Las XII Jornadas de Bioinformática serán en Sevilla


Ya es oficial. Las XII Jornadas de Bioinformática (http://www.bioinformaticsconference2014.org/) van a celebrarse en Sevilla, del 21 al 24 de Septiembre, en el cicCartuja (Centro de Investigaciones Científicas Isla de la Cartuja). Aunque las primeras ediciones de las Jornadas de Bioinformática se celebraban anualmente, desde hace unos años ha adoptado un formato bianual, acorde a los tiempos económicos en los que vivimos.

Los coordinadores de esta duodécima edición (Damien P. Devos, Ildefonso Cases y Ana M. Rojas) quieren que las nuevas generaciones de bioinformáticos se involucren en el evento, y por ello el tema principal de las Jornadas es “Bioinformatics: The New Breed“. Los principales puntos que se quieren destacar en esta edición son:

Las fechas claves del evento de momento confluyen en el 31 de Julio, que es cuando se cierra el plazo tanto para el envío de contribuciones a las Jornadas, como para el registro temprano (y más barato) en las mismas. Antes del 31 de Julio la cuota de inscripción es de 100€ para los estudiantes y 180€ para el resto, mientras que después de esa fecha costará 160€ para estudiantes y 230€ para el resto.

En el programa provisional se encuentra reservado el primer día para el simposio de estudiantes, dejando el segundo día para la metagenómica, la evolución y la filogenia, el tercer día para las charlas de estructura, función de proteínas y la bioinformática biomédica, dejando el día de clausura para la biología integrativa.

Así que ¡aún tenéis tiempo para animaros a asistir! Tanto para realizar la inscripción como el envío de contribuciones hay que registrarse en la página del congreso, en http://www.bioinformaticsconference2014.org/eng/enter .

Etiquetas:
Categorias: Congresos, Noticias

TopHat 2: arreglos para algunos fallos técnicos


Una parte de la bioinformática actual gira en torno a los análisis de datos de experimentos de ultrasecuenciación: ChIP-Seq, FAIRE-Seq y DNase-Seq, exome sequecing, RNA-Seq, … Una de las herramientas es TopHat (en el momento de escribir esta entrada iba por la versión 2.0.10), que se usa en los experimentos de RNA-Seq para identificar splice junctions tipo exón-exón… Para entender qué  es esto de los splice junctions tipo exón-exón, primero hay que recordar cómo funciona la síntesis de proteínas con estos esquemas de la Wikipedia inglesa:

Cuando una proteína del código genético de la célula va a ser producida por la maquinaria celular, lo primero que se hace es, dentro del núcleo, copiar el código genético correspondiente a los exones que representan a esa proteína, descartando normalmente otros exones alternativos del mismo gen (y de los demás genes). Todos esos exones son puestos de forma consecutiva en un ARN mensajero, que es el que sale del núcleo de la célula con esa información y viaja por el citoplasma hasta llegar a un ribosoma. Pero los procesos biológicos encargados de la composición del ARN mensajero pueden fallar, por ejemplo juntando exones correspondientes a proteínas de distintos genes. Estos procesos pueden estar alterados por defectos genéticos, y por diversas enfermedades, como por ejemplo todos los tipos de cáncer.

Los experimentos de RNA-Seq tratan de capturar la información sobre parte del transcriptoma (que sería el conjunto de todos los posibles ARN mensajeros), justo aquéllos que se encuentran en uso en las muestras usadas para el experimento de RNA-Seq. TopHat usa un genoma de referencia relacionado con los datos a analizar (por ejemplo, el genoma humano), información sobre los exones conocidos y a qué genes corresponden (proveniente de UCSC Genome Browser o Ensembl), y los datos a analizar como tal (del orden de decenas de GB).

TopHat, como casi todas las herramientas y pipelines de análisis del mundo NGS, está en continuo desarrollo y es bastante complejo (está escrito en Python 2.7 y C++), con lo que es inevitable que contenga fallos técnicos. Los datos de un experimento de RNA-Seq que tuvo que analizar una compañera de trabajo han tenido la “suerte” de ser capaz de disparar tres de estos fallos técnicos.

  1. Segmentation fault en segment_juncs: Como se puede ver en esta entrada de un foro de Google Groups, es un fallo existente de antes. La suerte es que en esa entrada vienen las pistas de cómo arreglar dicho fallo en el código fuente, en el fichero src/segment_juncs.cpp .
  2. AttributeError: 'NoneType' object has no attribute 'split' de tophat al relanzar un trabajo terminado abruptamente: tophat viene con la posibilidad de reiniciar trabajos de análisis que hayan terminado de forma abrupta, desde el punto en el que haya fallado. Pero ese mecanismo tiene fallos… Para los que programéis en otros lenguajes de programación, pero no en Python, ‘NoneType’ es la clase de los ‘None’, el equivalente a ‘undef’ de Perl, ‘nil’ de Ruby, ‘NULL’ de C y C++, ‘undefined’ de JavaScript, etc… También hubo suerte, porque en esta otra entrada del mismo foro de Google Groups, un usuario propone un arreglo que, aunque no sea muy ortodoxo ni correcto, hace que tophat continúe.
  3. Segmentation fault en tophat_reports: Aunque este fallo está más o menos documentado en el mismo foro de Google Groups, nadie propone un arreglo. Pero investigando un poco aquí, descubrí que el fallo se encuentra en el fichero src/tophat_reports.cpp, por una razón similar a la descrita en el fallo de segment_juncs.

 Actualización

Para que os sea más fácil arreglar estos problemas si os topáis con ellos, he puesto los parches derivados de los arreglos en un repositorio de GitHub: https://github.com/inab/tophat2-patches

Actualización 2

Hemos encontrado para nuestro caso la causa principal de los dos Segmentation fault. Había discrepancias entre el genoma de referencia y sus índices de bowtie, que se solucionaron ejecutando de vuelta bowtie-build.

Etiquetas:
Categorias: General

¿Por qué las publicaciones científicas están prisioneras detrás de un muro de pagos?


Normalmente, cuando veo una noticia o una entrada de un blog que es interesante para esta bitácora, intento plasmar un resumen personal del mismo, encontrar entradas independientes relacionadas en algún sentido y aportar mi granito de arena adicional, excavando un poco más en lo que he encontrado.

Pero siempre hay excepciones. En el blog Priceonomics, he encontrado la entrada Why is Science behind a paywall?, publicada por Alex Mayyasi el 10 de Mayo de 2013, que pienso que merece ser traducida íntegramente al castellano, al proporcionar una gran retrospectiva sobre por qué los descubrimientos científicos, y las publicaciones donde fueron hechos públicos, son como son (un poco más centrado en Estados Unidos que en el resto de países, todo sea dicho de paso). Espero no hacer un trabajo muy burdo…

Seguir leyendo »
Etiquetas:

La tabla periódica de los elementos bioinformáticos


Una de las formas que tienen las compañías de hacer propaganda de ellas mismas es crear contenidos lúdicos o educativos relacionados con su área de negocio. A veces, esos contenidos son interesantes, como es el caso de la tabla periódica de los elementos bioinformáticos (a continuación, un pantallazo), que ha sido creada por una compañía de consultoría bioinformática:

La tabla parece haber sido compuesta por gente principalmente versada en el análisis de datos de ultrasecuenciación, porque no incluye servidores ni herramientas de rutas metabólicas, text-mining, filogenia, etc…

Entonces, ¿qué herramientas y sitios web bioinformáticos añadirías a la tabla?

Etiquetas:
Categorias: General

Cursos de Verano


Hace ya tiempo que no escribo en el blog, y me da pena no poder dedicarle el tiempo que se merece. Por eso, para ver si arranco de nuevo, voy a escribir sobre este curso de verano de Bioinformática.

Hace más de 10 años, cuando los masters y los cursos que trataran Bioinformática y la Biología Computacional empezaron a estar más demandados, se celebró el primer Curso de Verano de la Universidad Complutense. El temario de este curso de verano, enfocado en los conocimientos y técnicas básicos para trabajar en Bioinformática, ha ido evolucionando, sin llegar a tocar temas más especializados y aún en evolución, como las herramientas y los análisis de resultados de NGS (lo cuál queda para cursos más especializados o avanzados como los máster), que de todas formas quedarían fuera de las posibilidades de un curso de verano.

Los puntos principales de este curso de verano son:

Si estáis interesados en el curso, y obviamente os lo podéis permitir, podéis encontrar más información sobre el mismo en http://ubio.bioinfo.cnio.es/Cursos/cursoVerano2013/

Etiquetas:
Categorias: Misceláneo

CHEMDNER, la subcompetición de identificación de nombres de compuestos y drogas


Bajo el acrónimo que inicia esta entrada de blog (CHEMDNER, Chemical compound and drug name recognition task) se encuentra una de las subcompeticiones de la próxima edición de BioCreative IV (Critical Assessment of Information Extraction in Biology). Lo primero que se le viene a uno a la mente cuando lee ese acrónimo es la frase “Pero eso ¿qué es?”, con el acento más basto y cateto con el que identificamos nuestra propia ignorancia.

BioCreative es una competición que se celebra para ver cómo se encuentra el estado del arte de la minería de textos en los campos de la biología, biomedicina, bioinformática, … y otros afines. CHEMDNER es una de las 5 subcompeticiones de BioCreative IV, y está enfocada en el reconocimiento de nombres de compuestos químicos y drogas/fármacos dentro de textos científicos y patentes, y de sus roles semánticos en el contexto de las oraciones, párrafos y manuscritos donde participan. Como el lenguaje natural es bastante ambiguo, aún en el subconjunto usado para el lenguaje científico, los sistemas automáticos creados por los participantes tienen que ser capaces, por ejemplo, de identificar que “aspirina”, C6H4(OCOCH3)COOH, CHEBI:15365 y “ácido acetilsalicílico” son la misma cosa (y es una droga), o que “cloruro sódico”, “NaCl” y “sal” se refieren a compuestos químicos, pero que el término “sal” puede ser o no sinónimo de los dos primeros según el contexto.

Así que, si os dedicáis a la minería de textos, tal vez os interese participar en ésta u otras de las subcompeticiones de BioCreative. Para el caso de CHEMDNER, os podéis registrar como grupo participante en http://www.biocreative.org/news/biocreative-iv/team/ , y podéis encontrar más detalles de la competición en http://www.biocreative.org/tasks/biocreative-iv/chemdner/

Etiquetas:
Categorias: Congresos, Noticias

Ensayos clínicos, o cómo explicar algo científico a la gente


Ayer mi amiga Gloria me mandó desde Singapur un correo de unas colegas suyas para participar en un ensayo clínico. Lo primero que viene a la mente es “para eso hay que estar presente, ¿no?”. Pues depende de lo que se vaya a ensayar…

En este caso, lo que se ensayan son contenidos didácticos multimedia, relacionados con la ruta metabólica de señalización Wnt. Para medir cómo de efectivos son los contenidos, utilizan la siguiente metodología:

Luego, con los resultados de todos los participantes, podrán medir si usar el juego o el contenido divulgativo en PDF sirven para aumentar o disminuir lo que los participantes saben sobre Wnt. El único requisito para todo este proceso es usar un navegador lo suficientemente moderno (vamos, un navegador actualizado con soporte de HTML5), en una máquina lo suficientemente moderna, al menos, para la parte del juego.

Si estáis interesados, todos los detalles para participar los podéis encontrar más abajo, en el correo original:

Dear all,
we need a large number of volunteer human test subjects for a pre-clinical trial of a novel method to get certain facts from molecular  biology across the blood-brain barrier.

The test was approved by MOE (really)  and most subject are expected to come out of the trial with a minimum long-term damage.

If you can donate 20 minutes of your time to science,  we would ask you to do the following:

  1. Go here and fill in a quick on-line quiz:  http://goo.gl/utgla
  2. Play an online game here: http://epsf.bmad.bii.a-star.edu.sg/games/wntgame.html
  3. Fill a similar test again: http://goo.gl/Q0CyJ

That’s all.

Notes:

  • you don’t have to be a biologist to play the game – everybody is invited to try their hand
  • you don’t have to tell us who you are when you fill the quiz – the whole setup is actually testing us – the game designers -  and not the player
  • you do need a browser that supports html5 – the game gets cranky on older browsers and older computers
  • if you don’t like playing games, it would actually help us hugely if you would do the same quiz thing, but with flipping through a pdf document between the two quizzes, rather then playing (please ask us, Delia or Ivana)

Many thanks in advance to our brave volunteers,
Delia and Ivana

 

Etiquetas:
Categorias: General, Misceláneo