CHEMDNER, la subcompetición de identificación de nombres de compuestos y drogas

Bajo el acrónimo que inicia esta entrada de blog (CHEMDNER, Chemical compound and drug name recognition task) se encuentra una de las subcompeticiones de la próxima edición de BioCreative IV (Critical Assessment of Information Extraction in Biology). Lo primero que se le viene a uno a la mente cuando lee ese acrónimo es la frase «Pero eso ¿qué es?», con el acento más basto y cateto con el que identificamos nuestra propia ignorancia.

BioCreative es una competición que se celebra para ver cómo se encuentra el estado del arte de la minería de textos en los campos de la biología, biomedicina, bioinformática, … y otros afines. CHEMDNER es una de las 5 subcompeticiones de BioCreative IV, y está enfocada en el reconocimiento de nombres de compuestos químicos y drogas/fármacos dentro de textos científicos y patentes, y de sus roles semánticos en el contexto de las oraciones, párrafos y manuscritos donde participan. Como el lenguaje natural es bastante ambiguo, aún en el subconjunto usado para el lenguaje científico, los sistemas automáticos creados por los participantes tienen que ser capaces, por ejemplo, de identificar que «aspirina», C6H4(OCOCH3)COOH, CHEBI:15365 y «ácido acetilsalicílico» son la misma cosa (y es una droga), o que «cloruro sódico», «NaCl» y «sal» se refieren a compuestos químicos, pero que el término «sal» puede ser o no sinónimo de los dos primeros según el contexto.

Así que, si os dedicáis a la minería de textos, tal vez os interese participar en ésta u otras de las subcompeticiones de BioCreative. Para el caso de CHEMDNER, os podéis registrar como grupo participante en http://www.biocreative.org/news/biocreative-iv/team/ , y podéis encontrar más detalles de la competición en http://www.biocreative.org/tasks/biocreative-iv/chemdner/

Compartir:

Un comentario

Deja un comentario