Google desarrolla un buscador de imágenes basado en el contenido
Tal y como describe la noticia original, del New York Times del 28 de Abril, científicos de Google han sido capaces de desarrollar un algoritmo similar al PageRank pero que trabaja con el contenido de las imágenes (reconociendo formas y analizando su parecido) y no con el texto contextual. Shumeet Baluja, investigador senior en Google, comentaba durante la presentación que realizó con Yushi Jing, que “nosotros queremos incorporar todos los avances de la Visión por Computador en un entorno Web”. La gran experiencia de la compañía en crear gigantescos grafos dónde los nodos (webs) son valorados o pesados, acorde a su autoridad, puede ser transportada al mundo de las imágenes.
El artículo presentado en esta conferencia, “PageRank for Product Image Search“, se centra en un subconjunto de las imágenes que Google ha catalogado, ya que el análisis y comparación de imágenes digitales requiere de un coste computacional tremendo. Realizar esta labor para todas las imágenes indexadas por el buscador sería una tarea casi imposible, a día de hoy. A pesar que Google no aporta datos acerca de cuántas imágenes tiene catalogadas, aseguran que Google Image Search es “la búsqueda de imágenes más amplia de toda la Web”.
Este tipo de tecnología puede resultar muy útil, no solo para buscar imágenes parecidas entre si, si no para la recuperación de fotografías similares, si no para otros fines como la catalogación automática, la asociación de imágenes con categorías de ontologías permitiendo el razonamiento sobre las mismas, el filtrado de imágenes inapropiadas, etc. La recuperación y tratamiento avanzado de imágenes en la web sigue siendo un problema interesante, con mucho trabajo por hacer y, por tanto, un nicho de investigación más que interesante.
Si te gustó esta entrada anímate a escribir un comentario o suscribirte al feed y obtener los artículos futuros en tu lector de feeds.







Hola