Las matemáticas y el procesamiento de imágenes (II)

En el mes de junio publicamos la primera parte de un este artículo Las matemáticas y el procesamiento de imágenes (I).

En esta segunda entrega haremos referencia a la fotografía digital, el procesamiento de imágenes satelitales, la reconstrucción tridimensional a partir de imágenes estéreo o vídeo, el reconocimiento de formas y búsqueda de imágenes en bases de datos, el campo del procesamiento y análisis de las imágenes médicas, la codificación y compresión de imágenes y los gráficos por ordenador y procesamiento de superfícies.

La fotografía digital

El auge de la fotografía digital (con cámaras o teléfonos móviles) y las posibilidades que con ella se abren es un campo fértil para el desarrollo de herramientas de software dirigidas a la mejora de la calidad de las imágenes, a la mejora del contraste de color, la corrección de distorsiones, la mejora de la nitidez, el aumento de resolución, etc [4]. Con estas herramientas técnicas los usuarios pueden conseguir con el teléfono móvil fotografías de gran calidad. Este campo permite desarrollar y hacer efectivos muchos de los algoritmos básicos de procesamiento de imágenes.

Procesamiento de imágenes satelitales

Ésta es una de las áreas tradicionales del procesamiento de imágenes para la que se han desarrollado y se siguen desarrollando muchos algoritmos: deconvolución y eliminación de ruido, fusión de imágenes multiespectrales, reconstrucción de modelos digitales de elevación de terreno y de topografía urbana. Por otro lado, el uso de imágenes satelitales en agricultura o teledetección plantea problemas de segmentación y de reconocimiento de patrones, sean éstos ríos, carreteras, zonas urbanas, o rurales, por no hablar de las numerosas aplicaciones militares [19, 20].

 

Fusión de imágenes multiespectrales

Reconstrucción tridimensional a partir de imágenes estéreo o vídeo

Ésta es otra de las áreas clásicas de la visión por ordenador, el de la reconstrucción tridimensional de una escena a partir de pares de imágenes estéreo o de secuencias de imágenes. Buscar la imagen

La base de estas aplicaciones es la geometría proyectiva y la calibración de cámaras y sus desarrollos han sido espectaculares en los últimos 15 años [5]. Entre otras múltiples aplicaciones mencionemos la de la reconstrucción tridimensional de sitios históricos o cascos urbanos a partir de vídeo lo que ofrecería posibilidades de navegación mucho más sofisticadas que las que podemos tener actualmente con Google Earth [6]. Finalmente y en el ámbito de las aplicaciones médicas, podemos mencionar a título de ejemplo la reconstrucción – y visualización – del tracto digestivo a partir de las imágenes obtenidas por endoscopia [7].
 

Reconocimiento de formas y búsqueda de imágenes en bases de datos

El reconocimiento de formas es uno de los objetivos fundamentales del análisis de imágenes y, a pesar de los desarrollos espectaculares que se han producido en tiempos recientes, aún estamos lejos de poseer algoritmos industriales, por ejemplo, para la detección de logos en la publicidad [8].

Las numerosas aplicaciones industriales van a ser un motor de desarrollo de este campo: piénsese en la necesidad de buscar imágenes por su contenido en la web (compárese con la facilidad para buscar textos) u otras bases de datos (piense en la posibilidad de identificar un objeto concreto en una base de datos de objetos robados) [9]. Entre otras posibles aplicaciones industriales mencionemos las ligadas al control de calidad, piénsese en el control automático de la calidad en industrias de azulejos por análisis de los patrones de textura de los mismos.

Por otra parte, el reconocimiento de formas o patrones es el hecho clave de la visión humana y su estudio está relacionado con la psicología y la neurociencia [21]. La interacción de estas disciplinas es fundamental para el avance de la visión computacional.

El campo del procesamiento y análisis de las imágenes médicas

Éste es uno de los campos más vastos dentro del procesamiento de imágenes y abarca desde su adquisición hasta su procesamiento e interpretación como ayuda al diagnóstico. Aunque existen numerosos equipos de investigación dentro de las empresas que construyen los aparatos de adquisición, el análisis de estas imágenes como ayuda al diagnóstico es un campo en el que queda mucho camino por recorrer. Existen grupos de investigadores especializados en el estudio de imágenes de cada uno de los órganos del cuerpo humano: cerebro, corazón, hígado, sistema vascular, etc. En muchos de estos casos, el primer paso es la segmentación para la reconstrucción tridimensional del órgano en cuestión a partir de las imágenes dadas. Para mencionar un ejemplo que ilustra las múltiples implicaciones del problema, mencionemos el caso del estudio del sistema vascular: este estudio requiere la obtención de modelos anatómicos individualizados, el estudio y caracterización morfológica del dicho sistema o alguna de sus partes donde haya un problema, y eventuales simulaciones de dinámica de fluidos para comprender las presiones a que se ve sometida la estructura en cuestión [10, 11]. Hemos mencionado este caso para dar a entender la complejidad del problema y la necesidad de una interacción multidisciplinar que sólo está al alcance de equipos muy potentes y estructurados.

Imagen de un cerebro cuando sufre una intensa migraña

Codificación y compresión de imágenes

Este área es una de las que han tenido un desarrollo más espectacular en los últimos 20 años llevando al desarrollo de los estándares actuales de compresión tipo JPEG o MPEG [13, 14]. Los desarrollos en compresión de imágenes han estado ligados a la palabra clave «wavelets» (ondículas, en castellano) y el actual JPEG 2000 [12] está basado en esta herramienta de compresión.

Las wavelets se desarrollaron a partir de una interacción fructífera entre ingenieros, físicos y matemáticos, y podemos decir en este caso, que los matemáticos jugaron un papel fundamental [15]. Los nombres de Jean Morlet, Alex Grossman, Yves Meyer, Stéphane Mallat, Ingrid Daubechies son nombres de actores principales en este capítulo. Actualmente, la compresión sigue atrayendo la atención de muchos investigadores (como se refleja en las numerosas publicaciones en revistas y congresos) debido a la cantidad inmensa de datos que almacenar.

Gráficos por ordenador y procesamiento de superfícies

Ésta es un área muy desarrollada con fuertes conexiones industriales como por ejemplo con la industria del automóvil, la industria del cine o los videojuegos. Existen ya múltiples herramientas para crear imágenes sintéticas o representar y visualizar superfícies de objetos industriales con la iluminación adecuada [7]. Algunos de los problemas arriba mencionados, como la reconstrucción del tracto digestivo a partir de endoscopias, o la reconstrucción de zonas urbanas o sitios históricos a partir de vídeos reales, plantean numerosos problemas de reconstrucción y visualización de superfícies, que atraen la atención de los investigadores [22], y que merecen ser impulsados en el contexto nacional.

Digamos, finalmente, que estos ejemplos son sólo eso, ejemplos en un vasto mar de aplicaciones en las cuales interviene el procesamiento de imágenes y la visión por ordenador, y esto no es más que un ejemplo de procesamiento de datos siendo éstos datos con estructura geométrica bidimensional (como es el caso de las fotografías), tridimensional (caso de imágenes 3D o secuencias de vídeo), o incluso tetra-dimensional (para el caso de imágenes 3D en movimiento).

[4] DXO: Photography, D-SLR and high end digicam automatic image quality enhancement, http://www.dxo.com/en/photo/home/default.php
[5] Hartley, R.; Zisserman, A.; Multiple View Geometry in Computer Vision, Cambridge University press, (2004).
[6] Dick, A.R.; Torr, P.H.S.; Cipolla, R.; Modelling and Interpretation of Architecture from Several Images. International Journal of Computer Vision archive 60(2), (2004), (111-134).
[7] Greiner, G.; Personal communication. http://www9.informatik.uni-erlangen.de  

[9] Sagarmay, D.; Zhang, Y.; An overview of content-based image retrieval techniques, Advanced Information Networking and Applications, 2004. AINA 2004. 18th International   Conference, (2004), (59-64).
[10] Frangi, A.F.; Niessen, W.J.; Viergever, M.A.; Three-dimensional modeling for functional analysis of cardiac images, a review, Medical Imaging, IEEE Transactions on Volume 20, Issue 1, (Jan 2001), (2-5).
[11] Frangi, A.F.; Laclaustra, M.; Lamata, P.A.; A registration-based approach to quantify flowmediated dilation (FMD) of the brachial artery in ultrasound image sequences; Medical Imaging, IEEE Transactions on Volume 22, Issue 11, (2003), (1458-1469).
[12] Rao, K.R.; Huh, Y.; JPEG 2000, Video/Image Processing and Multimedia Communications 4th EURASIP-IEEE Region 8 International Symposium on VIPromCom 16-19, (2002), (1-6).
[13] Wallace, G.K.; The JPEG still picture compression standard, Consumer Electronics, IEEE Transactions on Volume 38, Issue 1, (Feb. 1992), (27-34).
[14] Sikora, T.;MPEG digital video-coding standards, Signal Processing Magazine, IEEE Volume 14, Issue 5, (1997), (82-100).
[15] Mallat, S.; A Wavelet Tutorial of Signal Processing, Academic Press, (1999).
[19] Remote Sensing and Image Processing, http://www.landcareresearch.co.nz/services/remotesensing/
[20] TTI Production, Earth Sciences and GIS, Satellite Mapping. http://www.tti.fr/
 [21] Deco, G.; Rolls, E.; Computational Neuroscience of Vision. Oxford University Press, (2001).
[22] Rumpf, M.; http://numod.ins.uni-bonn.de/people/rumpf/rumpf.shtml.

Compartir:

6 comentarios

  1. Hola, muy interesante tu información, me gustaria saber si tienes mas información avanzada, ya que estoy haciendo mi Tésis en Procesamiento de Imágenes…saludos.

  2. necesito saber como procesar imagenes capturado de la retina y como lo almaceno en la base de datos de antemano gracias nos vemos …

Deja un comentario