Qué es necesario para ser un «scientific database curator»

En la entrada anterior escribí una pequeña introducción a las bases de datos biológicas y bioinformáticas, pero no hablé de lo más importante: cómo están organizadas internamente. En una base de datos normal, como la del banco o la de la compañía telefónica, están muy claros los conceptos, los campos, qué almacenar, etc… Pero esto no sirve en un mundo conceptualmente cambiante como el de las ciencias de la vida. El conocimiento disponible sobre organismos, genes, proteínas, interacciones, estructuras, rutas metabólicas, etc.. va cambiando y evolucionando a medida que aparecen nuevas evidencias, y también el conocimiento subyacente, los conceptos en los que se sustenta la organización interna de cada una de ellas.

Y aquí entran en juego los scientific database curators, los conservadores de las bases de datos científicas. Ellos son los encargados de añadir nuevas entradas, de que el conocimiento de la base de datos que conservan no sea erróneo y de relacionarlo con el conocimiento disponible en otras bases de datos biológicas y bioinformáticas. Es un trabajo de mucha responsabilidad, y aquí os incluyo por ejemplo una oferta de empleo (recibida de Leticia, una de mis nuevas compañeras de trabajo) para un curator de la base de datos de interacciones entre proteínas IntAct:

Location:    EBI – Hinxton, UK
Staff Category:    Staff Member
Contract Duration:    3 years
Grading:    5 or 6, depending on experience and qualifications
Closing Date:    10 April 2011
Reference number:    EBI_00070

Job Description

We are seeking a Scientific Database Curator, to join the Proteomics Services team at the European Bioinformatics Institute (EBI) located on the Wellcome Trust Genome Campus near Cambridge in the UK.

The Database Curator will contribute to the maintenance and extension of the IntAct molecular interaction database. The main task is the analysis of published literature on protein interactions and their integration into the IntAct database. The successful candidate will also interact with external data producers and international partner databases to ensure highest quality standards for IntAct data.

The European Bioinformatics Institute (EBI) provides cutting-edge research, service and training in the field of bioinformatics and is home to world class bioinformatics resources such as Ensembl, UniProt, and InterPro.

For further information please visit http://www.ebi.ac.uk/intact/

Qualifications and Experience
The ideal candidate will hold a PhD or MSc in molecular biology, biochemistry, or a related subject. An interest in bioinformatics is required, prior experience in database curation, analysis of protein interactions, molecular pathways or cellular complexes is a plus.

The post holder should be able to work independently and interact well within a team environment. Good communication and interpersonal skills as well as a working knowledge of English language are essential.

Application Instructions
Please apply online through www.embl.org/jobs

Como podéis leer, los curators de bases de datos tienen que tener un profundo conocimiento del dominio del problema, mucha experiencia (tanto experimental como in-silico), y ser usuarios de herramientas bioinformáticas que les ayuden en las tareas de decisión a la hora de añadir nuevo conocimiento o alterar el ya existente. Sus esfuerzos (muchas veces ocultos tras la marea de datos que manejamos día a día) son los que permiten que las herramientas que utilizan técnicas predictivas basadas en la premisa de «culpable por asociación» (si se parece a un burro, lleva arreos de burro, rebuzna y da coces, y aparece en una obra de Juan Ramón Jiménez, entonces es un burro o un primo suyo) funcionen, y es la premisa clave de muchos desarrollos bioinformáticos.

http://www.ebi.ac.uk/intact/
Compartir:

2 comentarios

  1. Buen artículo siguiendo en la línea de divulgación de la problemática de las enormes cantidades de datos con origen en la «biomedicina».

    Nosotros hemos hecho una herramienta para ayudar a los curadores de textos científicos a asignarles conceptos de la base de datos UMLS.
    La herramienta se llama bioLabeler y puedes acceder a ella aquí:
    http://biolabeler.com

    A seguir divulgando.
    Un saludo y enhorabuena.

  2. La cuestión que aquí habría que plantearse es si este trabajo debe hacerlo un experto en la materia en cuestión o un experto en gestión de la información. ¿Es preferible que el mantenimiento de la base de datos lo haga un biólogo o un documentalista?
    Lo ideal sería que tuviera formación en ambos campos, claro, pero va a ser muy difícil encontrar a alguien con ese perfil.
    Puesto que se trata del mantenimiento de una base de datos, creo que el perfil ideal sería el de un experto en Información y Documentación, que contase con algún biólogo para asesorarle, pero el responsable último debería ser un documentalista.

Deja un comentario