Escalabilidad computacional de algunas aplicaciones: reconocimiento de caras
Leía el otro día una noticia sobre la importancia extrema de un nuevo resultado de investigación en forma de aplicación: el reconocimiento de caras. Hasta el momento, todas las investigaciones trataban de medir proporciones en las caras para entrenar un clasificador y poder reconocer una cara humana en una base de datos conocida. Métricas y métricas, clasificadores y clasificadores, años de investigación que podrían quedar casi en el olvido una vez se imponga el enfoque adoptado por el Dr. Yi Ma de la Universidad de Illinois at Urbana-Champaign (UIUC).
El equipo investigador aplica modernas técnicas de representación dispersa (sparse representation) y teorías de muestreado comprimido (compressed sensing) para trabajar con la imagen completa de la cara y no solo a partir de la extracción de ciertas características biométricas. La capacidad de su sistema de reconocimiento de caras es totalmente sorprendente para la comunidad científica y es que, bajo un enfoque totalmente diferente al que se venía utilizando, la precisión del reconocedor es muy superior a los de anteriores trabajos, incluso ocultando características esenciales como nariz u ojos, y capaz de superar al cerebro humano (según palabras del propio Dr. Ma).
El interés de este trabajo no se ha hecho esperar y el equipo investigador ya tiene varias empresas interesadas en licenciar su investigación. Aplicaciones del reconocedor de caras no se van a hacer esperar y desde el etiquetado automático de caras en imágenes, hasta identificación facial automática con propósitos de videovigilancia y seguridad, pueden estar a las puertas de la realidad cotidiana. El sistema puede trabajar en tiempo real para un conjunto de unos 1000 individuos pero el equipo investigador ya está colaborando con otros equipos de la UIUC para acelerar sus soluciones a través de un enfoque paralelo así como mediante implementaciones sobre hardware gráfico. La intención de esta aceleración es que el sistema pueda escalar varios órdenes de magnitud, y llegar a procesar en tiempo real hasta millones de sujetos.
El procesamiento de imágenes en cualquiera de sus modalidades (imagen médica, imagen satélite, imagen de diversos espectros, etc.) se puede beneficiar del paralelismo que ofrecen las nuevas arquitecturas de consumo. Las imágenes poseen multitud de datos (píxeles) cuyo procesamiento suele ser independiente, o dependiente en pequeñas vecindades locales, de modo que diversos procesadores o núcleos de procesamiento se pueden encargar de trabajar con particiones del espacio de datos de forma simultánea, acelerando así el proceso global. El reconocedor de caras del Dr. Yi Ma trabaja con la imagen completa, por lo que es más clara su posible adaptación a un entorno paralelo y por tanto una buena escalabilidad.
Enlaces de interés:
Artículo de divulgativo: http://www.wired.com/science/discoveries/news/2008/03/new_face_recognition
Web del proyecto: http://perception.csl.illinois.edu/recognition/Home.html
Artículo científico (PAMI): http://perception.csl.illinois.edu/recognition/Files/PAMI_Occlusion
Estuve estudiando el articulo y me parece algo fenomenal, me gustaria poder mantenerme en contacto, apara futuras versiones