Las XIII Jornadas de Bioinformática (JBI2016) se celebrarán en Mayo de 2016


Las Jornadas de Bioinformática se llevan celebrando desde el año 2000, siendo el evento científico que aglutina edición tras edición a las distintas comunidades de investigación relacionadas con la bioinformática y la biología computacional que se encuentran asentadas en España. Las primeras ediciones se celebraron de forma anual, cambiando su frecuencia de celebración a un modelo más espaciado de aproximadamente 18 meses.

XIII Symposium on Bioinformatics - XIII Jornadas de Bioinformática

Hace tres semanas me llegó un correo anunciando que la próxima edición de las Jornadas de Bioinformática (ya la decimotercera) se celebrará en el campus Vera de la Universitat Politècnica de València (enlace al lugar de celebración), teniendo lugar del 10 al 13 de Mayo. Como es habitual, el primer día se celebrará el Student Symposium, quedando el resto de días para el grueso de la conferencia.

Si queréis mandar vuestras contribuciones al evento, aquí tenéis el enlace de inscripción y el enlace de envío de abstracts. Las fechas claves son:

Hay un enlace disponible para consultar el programa tentativo de la conferencia, que irá cambiando a medida que el comité científico decida qué abstracts tendrán derecho a charla, y los ponentes de las charlas plenarias.

Enlaces

Etiquetas: ,
Categorias: Congresos, Noticias

Cuando la xenofobia se mezcla con una herramienta bioinformática


Nunca pensé que iba a escribir un artículo así. En serio. Todos sabéis que los investigadores tienen fama de ser personajes peculiares o excéntricos. Incluso los que os movéis en el mundo de la investigación seguro que habréis conocido a algún personaje difícil de tratar. Pero saber que todos los que estamos en el mundo de la investigación “cojeemos” de un pie u otro nunca me preparó para encontrarme un caso como el siguiente.

Existe una herramienta llamada TREEFINDER, escrita para calcular los árboles filogenéticos a partir de secuencias moleculares. A diferencia de lo que he hecho en otras entradas de blog sobre herramientas, no voy a evaluar la usabilidad o calidad científica de la misma. Gracias a unos cuántos amigos he descubierto que la licencia de uso es, por llamarlo suavemente, peculiar, sobre todo desde que la cambió su autor un par de veces durante este año. Si consultamos la página http://www.treefinder.de/news.html , el primer cambio fue en febrero, argumentando que a partir de ese instante su herramienta no podía ser usada en Estados Unidos, debido a que, en resumidas cuentas, sus creencias estaban en contra de lo que simboliza para él ese país.

Pero en esta ocasión, el cambio de la licencia de uso que ha decidido este individuo sobre su herramienta a partir del 1 de octubre es sobre varios países de la Unión Europea (Alemania, Austria, Francia, Países Bajos, Bélgica, Gran Bretaña, Suecia, Dinamarca) debido a que está en contra de la política migratoria de estos países con respecto a la acogida de refugiados de fuera de la Unión Europea. Esgrime que esas políticas le están dañando a él, a su familiares y amigos, etc…. En otras palabras, está prohibiendo el uso de su herramienta en varios países simplemente basándose en argumentos que rayan la xenofobia.

Yo respeto que cada uno crea en lo que quiera, aunque no comparta dicha creencia. De la misma manera, me gusta que la gente respete que yo crea en lo que quiera, sin implicar con ello que esas personas lleguen a creer en lo que yo creo. Pero personalmente no puedo respetar o considerar bioinformático o científico a alguien que intenta propagar sus ideas xenofóbicas a través de cambios en la licencia de uso de sus herramientas.

Actualización 2015-10-01

Ya hay movimientos dentro de la comunidad científica solicitando ayuda para evitar TREEFINDER (y su autor) reimplementando las funcionalidades de la herramienta:

 

Actualización 2015-12-15

Tal como apareció publicado hace un mes en Science News, la revista BMC Evolutionary Biology, donde fue publicado en 2004 el artículo de Treefinder, se ha retractado de la publicación de dicho artículo, al haber cambiado las condiciones de uso del software descrito en él, chocando con la política editorial de disponibilidad de software de dicha revista.

Una descripción detallada de dicha retractación está disponible en la web RetractionWatch.

Etiquetas:
Categorias: Noticias

B2DROP, compartiendo contenido científico con tus colaboradores


En el mundillo científico uno de los problemas más recurrentes es cómo pasarle tus ficheros de datos (ya sean primarios, de análisis, etc…) a tus colaboradores de otra institución. Si alguna de las instituciones dispone de esa facilidad, como un servidor FTP o HTTP de ficheros temporales, esta tarea se facilita. Pero la mayor parte del tiempo se recurre a servicios externos, tipo Dropbox, debido a la disponibilidad y ubicuidad de los mismos.

Sin embargo, la mayor parte del tiempo estas alternativas de intercambio puntual de contenidos adolecen problemas de privacidad, ya sea porque las transferencias se realizan sobre conexiones no seguras, ya sea porque los términos de uso del servicio no te garantizan la privacidad de esos datos. Por ello, uno de los objetivos de EUDAT es proveer ese tipo de servicio, y para ello han creado B2DROP. B2DROP usa por debajo la tecnología de ownCloud para gestionar el almacenamiento y la disponibilidad del mismo, usando una infraestructura propia de autenticación en el proyecto.

Cualquier investigador (básicamente, alguien con dirección de correo electrónico de un centro de investigación o universidad) que necesite una cuenta B2DROP puede crearla libremente. Para ello, visitando la web del proyecto se tiene la posibilidad tanto de acceder a tu cuenta recién creada como de crear una nueva. Una vez creada y confirmada la cuenta, el interfaz de gestión de tu almacenamiento en B2DROP es similar al de los sistemas de almacenamiento en la nube, con funcionalidades similares (como, por ejemplo, enviar un enlace de descarga, hacer pública una carpeta, etc..). Como todavía se encuentran en estado de prototipo, cada cuenta B2DROP tiene un límite de almacenamiento de 20GB.

Además del interfaz web, hay disponibles clientes nativos tanto para los principales sistemas operativos de ordenadores personales, como para dispositivos móviles. También es posible acceder a tus contenidos mediante el protocolo WebDAV, lo cuál abre la posibilidad de acceder a contenidos almacenados en B2DROP desde sistemas todavía no soportados mediante clientes nativos.

Enlaces

Etiquetas:

Ampliado el plazo para los abstracts en las XII Jornadas de Bioinformática


Tal como os conté el pasado 1 de Abril, la próxima edición de las Jornadas de Bioinformática (y van 12) se va a celebrar en Sevilla. Leyendo lo que escribí entonces me he dado cuenta que desde entonces ha cambiado varias veces el plazo de envío de abstracts, y de registro temprano.

La última noticia que tenía (de la semana pasada) era que ambos plazos vencían justo en el día de hoy, adelantándose así en un mes con respecto a lo que aparecía expuesto a principios de Abril. Pero, tras consultar de nuevo hace un instante la página principal del simposio para ver cuándo expiraba el plazo, me he encontrado con un nuevo cambio de fechas: el plazo de inscripción temprana ha sido ampliado hasta el 10 de Julio, mientras que el de envío de contribuciones se ha extendido hasta el 24 de Julio.

Para poder enviar vuestra contribución hay primero que registrarse, pero por ese lado la organización permite enviar hasta dos abstracts por persona registrada. Por otro lado, la SEBBM (Sociedad Española de Bioquímica y Biología Molecular) va a proporcionar hasta 6 becas de 200€ cada una para asistir a las Jornadas a aquellos que las soliciten y cumplan los requisitos para recibirlas.

Así que, si estais interesados en este simposio, aún estáis a tiempo de participar.

Etiquetas:
Categorias: Congresos

Cuando tus herramientas fallan: Ubuntu, R, ATLAS y fallos bizantinos


Como en cualquier profesión, nuestro trabajo depende tanto de nuestra profesionalidad como del buen funcionamiento de nuestras herramientas. Pero, ¿puede pasar que nuestras herramientas dejen de funcionar de forma correcta por una actualización? Por desgracia, todos sabemos que sí.

Esta situación ocurrió en nuestro laboratorio, y nos dimos cuenta la semana pasada. En la estación de trabajo de una compañera está instalada la distribución de Linux Ubuntu 12.10, y se le actualizó R (lenguaje y entorno de programación muy usado en cálculos estadísticos) hace cuatro semanas a la última versión, la 3.1.0, por paquete de Ubuntu. Las instalaciones de R en Ubuntu dependen de la implementación de BLAS (una librería matemática que define funciones de álgebra lineal) que haya activa. En Ubuntu hay disponibles varias: la implementación de referencia, la implementación de ATLAS, la implementación de OpenBLAS, etc… Como también se actualizaron los paquetes de Ubuntu de esa máquina, también hubo una actualización de la librería BLAS (estaba seleccionada ATLAS)… y algo pasaba con esa implementación.

Esta compañera empezó a sospechar que algo “raro” pasaba, cuando cálculos realizados meses atrás empezaron a salir distintos. ¿Cómo saber qué tenía la culpa? En estos casos hay que tener una dosis de suerte, y pensar lo impensable. Primero estuvo mirando si fue algún paquete de R, e intentando acotar el problema y su origen, se encontró con que cálculos tan sencillos en R como una regresión lineal daba resultados diferentes con cada ejecución para un mismo conjunto de datos. Este tipo de errores en el software es de los denominados fallos bizantinos, ya que no son fallos evidentes, y no son reproducibles.

Al ser lm una función básica de R, el problema podía estar en el propio R, en alguna librería que use R o en el hardware de la máquina (por ejemplo, un módulo de memoria defectuoso). Así que probamos a instalar R 3.1.0 a partir del código fuente, compilando con las opciones por defecto, y funcionaban los cálculos. Así que, ¿estaba mal compilado R, o qué pasaba? Aquí es donde intervino la suerte, cuando esta compañera se acordó que algunos paquetes de R habían dejado de funcionar con la actualización, y esos paquetes dependían de la librería BLAS del sistema. Buscando cómo reemplazar ATLAS de forma rápida y sencilla, encontramos esta entrada de blog donde se describe cómo activar OpenBLAS en Ubuntu. Y tras eso, el R 3.1.0 instalado por paquete empezó a funcionar de nuevo como debía.

¿Qué conclusiones salen de todo esto? No, no voy a decir que ATLAS sea una mala librería matemática, porque eso sería ser injusto con el trabajo y dedicación de sus desarrolladores. Ni que sea un problema de Ubuntu, porque posiblemente sea un fallo específico de la versión de ATLAS instalada con la versión de R instalada. La conclusión a nivel científico es que tenemos que ser capaces de reproducir nuestras investigaciones, y cuando no lo conseguimos, averiguar el por qué. Puede ser la metodología que hemos seguido, puede ser la implementación del método… o puede ser algo que no hayamos tenido en cuenta, como que no funciona bien alguna herramienta.

Actualización 30 de Junio de 2014

Algo que se me olvidó contar, pero que es muy importante, es que, cuando se cambian las librerías matemáticas de las que depende R (y en general, cualquier librería que sea usada por algún paquete de R), es más que recomendable reinstalar los paquetes que las estén usando. Tras el cambio a OpenBLAS se dio el caso de que la función lm funcionaba, mientras que otro paquete seguía fallando.

Otro detalle importante para evitar más problemas es que OpenBLAS tiene soporte multihebra que funciona muy bien cuando no hay otro tipo de paralelismo de por medio. Pero como hay paquetes de R o nuestro propio código que ejecutan en varios núcleos cuando éstos están disponibles, todo esto junto se lleva bastante mal. En los comentarios de la propia página mencionan este problema, y cuentan una de las maneras de desactivar el soporte multihebra de OpenBLAS. Estableciendo en el fichero de perfil .bashrc la variable de entorno OPENBLAS_NUM_THREADS, o la variable de entorno GOTO_NUM_THREADS, o la variable de entorno OMP_NUM_THREADS (asociada a OpenMP) a 1:

export OPENBLAS_NUM_THREADS=1

conseguimos evitar ese problema

Etiquetas:
Categorias: Misceláneo

Los accession numbers de UniProt tendrán más longitud a partir de Junio


UniProt es una de las bases de datos de proteínas más curada (en su sección SW) y mantenida actualmente, y por eso es tomada como una de las bases de datos de referencia a nivel de información de proteínas. Desde que se hizo pública en Julio de 1986 Swiss-Prot (una de las integrantes de UniProt, y predecesora), cada entrada de la base de datos dispone de un accession number (AC en el formato SW) principal, que sirve para identificar de forma inequívoca cada entrada. También se almacena para cada entrada cero o más accession number secundarios, que fueron usados en el pasado para esta entrada, y que sirven tanto para mantener un historial dentro de UniProt como para poder relacionar material de investigación antiguo (por ejemplo, artículos) con los datos actuales.

Inicialmente, un identificador de Swiss-Prot o TrEMBL tenía el siguiente formato de 6 caracteres:

1 2 3 4 5 6
[O,P,Q] [0-9] [A-Z,0-9] [A-Z,0-9] [A-Z,0-9] [0-9]

lo que permitía tener 13996800 entradas diferentes (3·10·(26+10)3·10). Posteriormente, se permitieron más letras en la primera posición (y menos en la tercera):

1 2 3 4 5 6
[O,P,Q] [0-9] [A-Z,0-9] [A-Z,0-9] [A-Z,0-9] [0-9]
[A-N,R-Z] [0-9] [A-Z] [A-Z,0-9] [A-Z,0-9] [0-9]

lo cuál aumentó el número de identificadores diferentes a 91497600 ((23·10·26·(26+10)2·10) = 77500800).

Pero, en la versión de Mayo de 2014 ya hay 56555610 entradas (545388 de UniProt/SwissProt y 56010222 de UniProt/TrEMBL), eso sin contar los accession number secundarios de dichas entradas. Los encargados de UniProt han hecho sus propios cálculos de estimación del crecimiento de la base de datos y de uso de accession numbers, y se han dado cuenta que para finales de 2014 se iban a quedar sin accession numbers para proteínas nuevas. Así que, a partir del 11 de Junio podrá haber entradas que usen, además de estos formatos, accession number de 10 caracteres:

1 2 3 4 5 6 7 8 9 10
[O,P,Q] [0-9] [A-Z,0-9] [A-Z,0-9] [A-Z,0-9] [0-9]
[A-N,R-Z] [0-9] [A-Z] [A-Z,0-9] [A-Z,0-9] [0-9]
[A-N,R-Z] [0-9] [A-Z] [A-Z,0-9] [A-Z,0-9] [0-9] [A-Z] [A-Z,0-9] [A-Z,0-9] [0-9]

que proporcionarán (23·10·(26·(26+10)2·10)2) = 2.6114669568·1013 nuevos identificadores (una diferencia de 6 órdenes de magnitud), margen suficiente para varios años más.

Enlaces

Etiquetas:
Categorias: General, Noticias

Workshop de Biología Computacional y de Sistemas en Comorbilidades de Enfermedades en ECCB’14


Del 7 al 10 de Septiembre de 2014 se va a celebrar el ECCB’14 en Estrasburgo (Francia), y tal como aparece en este tweet, entre los distintos workshops asociados a dicha conferencia se encuentra uno de Biología Computacional y de Sistemas en Comorbilidades de Enfermedades. Pero ¿qué son la morbilidad, la comorbilidad, y cuándo se dan comorbilidades de enfermedades?

La morbilidad, según la RAE, es “la proporción de personas que enferman en un sitio y tiempo determinado”, por lo que es una medida para saber la prevalencia de una enfermedad (cómo de común es). Y, transcribiendo de la definición de Wikipedia, “comorbilidad” es un término médico que se refiere a dos conceptos distintos:

Leyendo la página del workshop, la comorbilidad de enfermedades, o “multimorbilidad”, existe si dos o más desórdenes (defectos genéticos, enfermedades, etc…) afectan a los mismos individuos más frecuentemente que lo esperado en el caso común. El punto clave de la definición está en que esa coocurrencia de enfermedades sea la norma, en lugar de la excepción. Ciertos sectores de la población, como las personas mayores, están predispuestos a las multimorbilidades, lo cuál influye en la necesidad de mayores inversiones en sanidad pública para esos sectores.

Pero tal como declara la página del workshop, la reciente expansión de tanto las bases de datos biomédicas y conjuntos de datos post-genómicos asociados a distintas enfermedades, proveen ingentes cantidades de datos que permiten llevar a cabo investigaciones de comorbilidades entre los distintos desórdenes estudiados. Y justo ahí es donde entran en juego la biología computacional, la biología de sistemas y el workshop.

Tal como aparece en la página del workshop, éste está estructurado en tres sesiones, y se va a celebrar el 7 de Septiembre de 2014. Si tenéis interés de participar y aportar vuestro granito de arena a este workshop, desde el pasado 9 de Abril podéis enviar vuestros abstracts, usando el enlace de EasyChair del workshop. El plazo límite para enviar abstracts es el 15 de Mayo, y la comunicación de la aceptación o rechazo de vuestras contribuciones será el 26 de Mayo.

Enlaces

Etiquetas:
Categorias: General