Desarrollan un algoritmo matemático que eleva el porcentaje de acierto en la clasificación del polen al 97 por ciento
Fecha
Fuente
Universidad Nacional de Educación a Distancia UNED

Desarrollan un algoritmo matemático que eleva el porcentaje de acierto en la clasificación del polen al 97 por ciento

Los sistemas actuales, basados en el trabajo humano de identificación, se sitúan en el 63,5 por ciento.

La revista PLOS ONE publicó la semana pasada un trabajo de investigación titulado Improving Classification of Pollen Grain Images of the POLEN23E Dataset through three different Applications of Deep Learning Convolutional Neural Networks cuyos resultados muestran cómo la aplicación de algoritmos basados en técnicas de inteligencia artificial han aumentado la tasa de acierto en las técnicas de identificación de granos de polen en más de 30 puntos. Hasta la fecha, los trabajos de clasificación se realizan de forma manual por individuos que deben identificar visualmente los tipos de polen recogidos en las placas en las que impactan empleando su conocimiento previo sobre los mismos; incluso las técnicas actuales que introducen sistemas automáticos trabajan siguiendo estos patrones de actuación, por lo que los porcentajes de acierto son similares -en torno al 68,5 por ciento en caso de las técnicas automatizadas-. Sin embargo, con la aplicación del algoritmo matemático desarrollado en esta investigación se ha logrado situar este porcentaje en más del 97 por ciento. La investigación forma parte del Trabajo Fin de Máster del alumno Víctor Sevillano, quien ha cursado el Máster en Inteligencia Artificial Avanzadadel Departamento de Inteligencia Artificial de ETSI Informática de la Universidad Nacional de Educación a Distancia (UNED). Su director de proyecto e investigador Ramón y Cajal del departamento, José Luis Aznarte Mellado, es el coordinador del trabajo publicado.

Es Aznarte quien explica que "hasta el momento, el trabajo de conteo e identificación de tipos de polen es una tarea tediosa y poco eficaz realizada por personas generalmente en condiciones laborales precarias. Estos individuos reciben las placas en las que han impactado los granos de polen y, con la ayuda de un microscopio, tienen que diferenciar cuántos tipos distintos hay y en qué cantidad. El problema principal es que los granos de polen son muy similares entre sí, a veces están unidos unos a otros, o no están en buenas condiciones… de ahí que el trabajo no sea tan eficaz como debería y que la tasa de acierto se sitúe en el 63,57 por ciento". Sin embargo, conseguir que estos datos se acerquen lo máximo posible a la exactitud es de suma importancia, pues de ellos depende la información que reciben las personas con algún tipo de alergia, por ejemplo. Este aspecto se perfila como relevante por el aumento de la prevalencia de alergias, con un 30 por ciento de adultos y un 40 por ciento de niños que tienen al menos una alergia, según datos de la American College of Allergy, Asthma and Immunology recogidos en el estudio.

El modelo definido por Sevillano y Aznarte no es el primer intento de automatizar el proceso. "Existen otros modelos basados en el aprendizaje automático que enseñan a las máquinas a reconocer las mismas características que se manejan en la identificación visual: redondez, rugosidad, etc., pero la tasa de acierto apenas es superior, estableciéndose para los mismos datos que hemos usado en el 68,5 por ciento". La principal novedad que aporta el trabajo presentado por los dos investigadores de la UNED es que es el propio sistema el que se encarga de establecer qué características son más apropiadas para identificar los granos de polen recogidos y de aplicarlas a continuación. De hecho, definen tres modelos distintos basados en el uso de una Red Neuronal Convolucional (Convolutional Neural Network -CNN) que extrae automáticamente las características discriminantes de las imágenes. El profesor Aznarte añade que "estas características no son ni reconocibles ni interpretables, sino que están dentro del sistema y es el propio sistema el que discrimina cuáles son las importantes y cuáles no".

Tal y como se recoge en el artículo, "en el primer método, un clasificador simple se utiliza para catalogar las imágenes directamente desde las características extraídas por la CNN. El segundo método aplica una técnica conocida como Transfer learning o ‘aprendizaje por transferencia, y hace uso de una red neuronal profunda preentrenada (pre-trained deep neural network). Finalmente, el tercer método constituye una solución híbrida de los dos anteriores y es precisamente el que alcanza un éxito mayor: "Con una combinación de tres técnicas - transfer learning, feature extraction y lineal discriminnant", continúa Aznarte, "subimos el porcentaje de acierto al 97,23 por ciento".

La repercusión de esta información no se limita al mundo de la salud. La industria de la miel y los productos elaborados a partir de ella también podría resultar beneficiada, pues de la identificación del polen depende la correcta clasificación del producto final. Igualmente, el éxito en la catalogación de algunas muestras de estos granos podría favorecer investigaciones policiales en las que los pólenes atrapados en telas y cuerpos podrían determinar numerosos datos relacionados con los hechos investigados. Por todo ello, el mundo de la empresa ya está interesado en la aplicación de este algoritmo: "Estamos en contacto", afirma Aznarte, "con una empresa que comercializa un tipo de reconocedor de polen a nivel industrial".


Referencia bibliográfica:

Víctor Sevillan y José L. Aznarte, 2018. Improving classification of pollen grain images of the POLEN23E dataset through three different applications of deep learning convolutional neural networks. Plos One. DOI: 10.1371/journal.pone.0201807

Añadir nuevo comentario