Áreas

Áreas

Las áreas actuales de investigación que se llevan a cabo dentro del grupo son las siguientes:

Imagen-Vídeo Digital

Imagen y vídeo digital es un área activa de investigación que atrae la atención de un número importante de grupos institucionales de investigación y departamentos de I+D de empresas y organizaciones a lo largo de todo el mundo.

El avance de las tecnologías, comunicaciones y las herramientas de difusión de contenidos ha provocado una expansión sin precedentes del uso de la imagen en nuestra actividad cotidiana. Y esta explosión en el uso que hacemos de la imagen (tanto fija como en movimiento) tiene en la web su principal vehículo de expansión.

Redes sociales, blogs, plataformas como Google Images o Youtube ponen a disposición de los usuarios herramientas que nos facilitan y a la vez fomentan su utilización. No es de extrañar que alrededor de la imagen se concentre una importantísima actividad investigadora a la búsqueda de soluciones a nuevos problemas que hace sólo unos pocos años ni siquiera nos habíamos planteado.

Es en este contexto donde GIM desarrolla su principal actividad investigadora. En esta sección encontrareis información relevante sobre esta actividad, pero antes de adentrarnos en ella, vamos a introducirnos con algo más de detalle, el contexto de nuestra actividad investigadora.

Multimedia Retrieval

¿Qué es Multimedia Information Retrieval?

La consulta de información multimedia mediante ejemplo (Multimedia Information Retrieval, MIR) es un sistema de búsqueda para recuperar información similar (vídeos, imágenes, sonido, etc.) basándose en su contenido. En el caso de que se trate de imágenes (Content-Based Image Retrieval, CBIR), las características a tratar se refieren según su contexto a colores, formas, texturas o cualquier otra información que pueda derivarse de la propia imagen.

La mayoría de las técnicas a utilizar en CBIR desde el punto de vista del procesamiento de la imagen parten del campo del Reconocimiento de Patrones y Análisis de Imagen, cuyo objetivo principal la clasificación de objetos en un número determinado de categorías o clases. Si trabajamos con vídeos (Content-Based Video Retrieval, CBVR) las técnicas pueden ser muy parecidas, incorporando además características como su movimiento, relaciones entre fotogramas, rapidez entre cambios de escenas, etc. (procesamiento de vídeo digital).

Todo ello no está reñido en absoluto con el tratamiento clásico de esta información en las bases de datos mediante metadatos (etiquetas) o información textual adicional que puede ser incorporada automáticamente (por ejemplo, fecha de la toma, características del dispositivo, parámetros de la toma, etc.) o manualmente (autor, etiquetas descriptivas del documento, etc.)

Para facilitar la recuperación de la información multimedia de forma efectiva (correcta) y eficiente (rápida) es preciso indexar los documentos. En el caso de colecciones muy voluminosas, contar con metadatos descriptivos suficientemente relevantes no resulta fácil y es aquí donde toman fuerza los sistemas automáticos de recuperación basados en el contenido, los cuales extraen -a partir del procesado del documento- información que permita caracterizarlo convenientemente. Este proceso automático se denomina extracción de características.

En este tipo de sistemas la subjetividad de la percepción humana condiciona enormemente el resultado de las consultas. De esta forma, la extracción de características automáticamente a través métodos computacionales debe tener muy en cuenta este factor humano. En ocasiones resulta bastante difícil obtener resultados similares computacionalmente y los que realmente desea el usuario. Esta discrepancia es lo que se conoce como vacío semántico. Las características computacionales no tiene ese alto contenido semántico que poseen las características preceptúales humanas. De ahí la razón de ser de los sistemas MIR.

Log in