Archivo de mayo, 2011

Faculty of 1000 Posters

Algo que siempre he echado en falta en muchos congresos y reuniones es la posibilidad de consultar a posteriori los posters que he visto allí. Es cierto que los resúmenes de los posters aparecen en los libros de actas (o proceedings) de los congresos, pero no incluye ni de lejos todo el material que se presenta.

Así que al descubrir Faculty of 1000 Posters he sentido que se empieza a cubrir ese hueco. Este sitio web es un repositorio de acceso abierto para almacenar y consultar los posters de las áreas relacionadas con biología y medicina, emparentado con Faculty of 1000. Los posters son añadidos junto con su resumen, asignándoles los depositarios una licencia de reutilización (por ejemplo Creative Commons) para que sus derechos sean respetados. Los posters luego están disponibles en formato PDF, para que la gente los pueda ver en formato vectorial, pero con una marca de agua para que quede claro su origen y protegidos todo lo posible contra copia, para poder verlo pero no imprimirlo.

Para la gente que tenga dudas, la mayor parte de las revistas no van a ver la publicación de los posters en Faculty of 1000 Posters como una publicación previa, con lo que no afectará el que en el poster se presente un trabajo preliminar que posteriomente vaya a ser publicado en una revista. Además, en el caso de posters que aparecerán en una conferencia, los coordinadores del sitio garantizan que dichos posters no serán públicos hasta después de la celebración de dicha conferencia.

Enlaces

Etiquetas:

Servicio FTP de KEGG ¿de pago?

Hace un par de días nos han empezado a llegar a todos los que trabajamos en bioinformática correos conteniendo el siguiente párrafo:

Starting on July 1, 2011 the KEGG FTP site for academic users will be transferred from GenomeNet at Kyoto University to NPO Bioinformatics Japan, and it will be available only to paid subscribers. The publicly funded portion, the medicus directory, will continue to be freely accessible at GenomeNet. The KEGG FTP site for commercial customers managed by Pathway Solutions will remain unchanged. The new FTP site is available for free trial until the end of June.

Si además de este párrafo os leéis todos los párrafos de la fuente original (http://www.kegg.jp/kegg/docs/plea.html), veréis que es la transferencia organizativa del sitio FTP, sin los fondos necesarios en la organización de destino, la que ha llevado a esta situación.

Uno de los problemas de las bases de datos bioinformáticas es encontrar una financiación estable para poder seguir manteniéndola actualizada y curada. Muchas bases de datos noveles desaparecen por esta razón, y algunas con solera, como le pasa a KEGG o le pasó en su momento a BIND, tienen que pasar a ser de pago. Cuando una base de datos bioinformática útil (por ejemplo, que contiene datos experimentales únicos o una compilación de datos homogénea) deja de mantenerse, sus contenidos suelen desaparecer, lo cuál es grave teniendo en cuenta el dinero y el esfuerzo que fue necesario invertir para obtener los resultados experimentales.

Etiquetas:
Categorias: General

ADN, rompecabezas y evaluaciones

Aunque la noticia es ya antigua (me la pasó ya hace tiempo David Pisano), el mes pasado, los días 5 a 7 de Abril, se celebró en Barcelona la reunión derivada del SMAAP (Sequence Mapping And Assembly Assessment). Como ya he mencionado en el pasado en otras entradas de este blog, un assessment es una competición de una determinada área de interés científico (en este caso a nivel bioinformático), en la que una serie de grupos participantes compiten a la hora de desarrollar lo mejor posible una determinada tarea.

En el caso de SMAAP, el objetivo era realizar una evaluación bioinformática para comparar y determinar las mejores herramientas de secuenciación, mapeo y ensamblaje genómico. Las técnicas experimentales de secuenciación de alto rendimiento se basan en la premisa de que es muy fácil, fiable y automatizable a nivel experimental secuenciar trocitos de secuencia, en lugar de las secuencias genómicas completas. Para ello primero hay que generar a partir de la muestra que contiene las secuencias genómicas de interés muchas copias de las secuencias genómicas a secuenciar, romper las secuencias en trocitos del tamaño adecuado, secuenciar los trocitos, y luego recomponer el rompecabezas de trocitos de secuencia. Esta recomposición se hace con el tipo de herramientas antes mencionadas.

El resultado de este tipo de competiciones suele decidirse por una combinación de experiencia en el área de conocimiento a evaluar y desarrollos software. Los participantes suelen recibir de los organizadores primero un conjunto de datos de entrenamiento más los resultados esperables con los que poder entrenar y preparar sus herramientas para la competición. Después de eso, los participantes reciben de forma prolongada una serie de conjuntos de datos a evaluar, y dicho conjunto debería ser lo menos sesgado posible y lo suficientemente representativo en el dominio científico a evaluar, para que los resultados derivados de comparar las evaluaciones con los datos reales o esperables sea lo menos sesgado posible.

Enlaces

Etiquetas:
Categorias: General