GIM participa en la edición 2012 de TRECVID

Bajo las siglas TREC (Text REtrieval Conference) se agrupan una serie de conferencias que tienen por objeto fomentar la investigación en la amplia disciplina de recuperación de la información, proporcionando colecciones de documentos experimentales y procedimientos de evaluación homogéneos, así como un espacio común para que los diferentes equipos de investigación puedan confrontar sus avances en esta materia. Esta serie está patrocinada por el National Institute of Standards and Technology (NIST), que actualmente forma parte del departamento de comercio del gobierno de los Estados Unidos. Aunque durante muchos años, TREC ofrecía soporte para la evaluación de técnicas de recuperación de documentos de texto,  a partir de 2001 la conferencia patrocinó una actividad («track») centrada en documentos de vídeo, más concretamente enfocada en la segmentación automática, indexación y recuperación de vídeo digital basada en contenido. A tenor del interés suscitado por esta nueva actividad, en 2003, se creó una conferencia específica para abordar la problemática de la recuperación de información en colecciones de vídeo digital. Esta conferencia se denominó TRECVID e incorpora un taller («workshop») que tiene lugar justo antes de la conferencia TREC.

TRECVID por tanto acoge cada año un evento en el cual, las organizaciones interesadas en investigar aspectos de recuperación de información en colecciones de vídeo, pueden tomar parte en una serie coordinada de experimentos que usan los mismos datos experimentales. El objetivo de TRECVID es crear la infraestructura necesaria para la evaluación a gran escala de técnicas y métodos desarrollados por los investigadores  en el diseño y construcción de sistemas de recuperación que contemplen el vídeo como documento base.

En la edición de 2012, TRECVID propone un total de 5 tareas diferentes alrededor de la recuperación de vídeo. Nuestro grupo de investigación GIM, animado por los avances conseguidos en el proyecto vManager de almacenamiento y recuperación en colecciones de vídeo digital,  participa en una de ellas denominada Semantic Indexing. La tarea específica consiste en lo siguiente: «dada una colección de documentos de vídeo y una lista de conceptos semánticos, obtener para cada concepto un listado de a lo sumo 2000 tomas de vídeo de la colección ordenado según la probabilidad de que dicha toma contenga el concepto indicado».

Aunque resulta una decisión arriesgada por el compromiso que supone para el grupo presentar en tiempo y forma unos resultados relevantes y comparables a los del resto de grupos que participan (algunos de ellos de gran prestigio en el contexto internacional), estamos convencidos de que esta decisión apunta en el sentido correcto y generará a medio plazo beneficios para GIM.

La asignación automática de etiquetas semánticas que representan conceptos visuales a segmentos de vídeo (tomas) es una tecnología de mucha utilidad para el filtrado, categorización, visualización, búsqueda y otras formas de explotación del vídeo. En próximas entradas contaré las técnicas más frecuentes que  se utilizan actualmente para llevar a cabo la detección de conceptos semánticos en vídeos.

Acerca de barrena

Bienvenidos a este diario, semanario, mensuario o como quiera que se desee denominar a este espacio donde intento comunicar los hechos más relevantes de mi actividad académica.
Esta entrada fue publicada en Investigación. Guarda el enlace permanente.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *