Proyecto Fin de Carrera Juan Manuel García-Agúndez Moro: “Medidas de semejanza en bases de datos de imágenes genéricas”

Otro de los Proyectos Fin de Carrera (PFC) que presentamos dentro del grupo GIM (Grupo de Ingeniería de Medios) en la pasada convocatoria de «febrero de 2013» fue el de Juan Manuel García-Agúndez Moro titulado: “Medidas de semejanza en bases de datos de imágenes genéricas”. Los directores de dicho trabajo son: Marisa Durán y Andrés Caro. En el tribunal estaban Manuel Barrena, Pablo Gª Rguez y Mar Ávila.

 

 

 

Podemos definir la semejanza como una medida que cuantifica la relación entre dos objetos o imágenes, es decir, el porcentaje de semejanza que existe entre dos de ellos. El problema que se plantea en este PFC es cómo analizar y medir esa similitud entre imágenes.

 

Para realizar el análisis de semejanza se han desarrollado varios tipos de modelos diferentes que se aplicarán sobre una base de datos de imágenes.

 

 

En primer lugar hemos desarrollado dos modelos basados en distancias geométricas. Estos modelos evalúan la similitud calculando la distancia entre objetos definidos por sus características. Estos modelos están basados en la representación de los elementos de un conjunto como puntos en un espacio multidimensional, de forma que la distancia métrica entre dos puntos nos da una idea de cuán semejantes o diferentes son. La medida de distancia entre cualquier par de puntos debe cumplir los tres axiomas métricos siguientes: minimalidad, simetría y desigualdad triangular. Uno de los problemas de estos modelos es que en situaciones experimentadas con humanos han presentado datos contradictorios. Este tipo de medidas no obtiene buenos resultados cuando las imágenes son muy parecidas o cuando varias características de distintas imágenes toman valores similares o incluso toman los mismos valores en distintos planos.

 

 

En segundo lugar se han desarrollado dos modelos basados en características. Estos modelos pretenden solucionar algunos de los problemas no resueltos por los modelos basados en distancias geométricas. Dentro de los modelos de características se han implementado el modelo de contraste y el proporcional, basados en la teoría de la similitud planteada por Amos Tversky en 1977 y apoyada en estudios sobre la percepción humana. Estos modelos consideran que la similitud entre dos imágenes depende de las características exclusivas de cada imagen y de las que comparten ambas. Estableciendo una relación entre estos conjuntos se puede obtener una medida de similitud entre dos imágenes u objetos.

 

 

En tercer lugar se han implementado tres de los modelos utilizados en la aplicación Qatris iManager, que trabaja con las mismas características que nuestra base de datos de ejemplo. Más concretamente se han incluido un modelo que sólo trabaja con características de color, otro igual al anterior, pero que se centra en los colores más relevantes de la imagen consulta, y, por último, uno que sólo tiene en cuenta las características del grupo de forma.

 

 

Finalmente, se han implementado dos modelos combinados que obtienen la similitud entre dos imágenes a partir de la calculada por otros métodos aplicados a cada uno de los tres grupos de características. Son el modelo promedio, que calcula la media de las similitudes, y el combinado, que se basa en probabilidades para obtener sus resultados.

 

 

El objetivo principal de este proyecto consistió en analizar diversas formas de cuantificar la semejanza entre imágenes. Para ello se aplicaron distintos modelos desarrollados sobre una base de datos de imágenes clasificadas en grupos, con el fin de evaluar y comparar dichos modelos. Para valorar los mejores resultados se han elaborado gráficas de precisión frente a exhaustividad para poder comparar cuáles son los modelos más adecuados.

 


De los resultados obtenidos al aplicar los distintos modelos sobre la base de datos, podemos concluir que los resultados obtenidos con los modelos de características son muy buenos y que, en general, son mejores que los obtenidos con los modelos basados en distancias geométricas. Los modelos de color consiguen los mejores resultados con su grupo de características y el de forma se comporta de una forma muy parecida a los modelos geométricos. El modelo promedio tiene unos resultados aceptables y el combinado, muy malos.

 

 

 

pablogarguez

@pablogarguez es actualmente #Investigador y Profesor Titular de Ingeniería Informática de la Escuela Politécnica en la Universidad de Extremadura en Cáceres. Ha sido Director General de Agenda Digital de la Consejería de Economía, Ciencia y Agenda Digital de la Junta de Extremadura, desde septiembre de 2019 a agosto de 2023. Fue Director de la Escuela Politécnica de Cáceres (School of Technology) de la Universidad de Extremadura durante 3 años (2017-2019), con titulaciones de grado, máster y doctorado en los campos de Ingeniería Civil, Edificación, Informática y Telecomunicaciones. Su trayectoria docente comienza en 1997 básicamente en asignaturas de Programación y de Bases de Datos. Su actividad investigadora se ha centrado en el Reconocimiento de Patrones y la Ciberseguridad. Fruto de esta labor de investigación, resaltar que es coautor de más de veinte artículos publicados en revistas internacionales indexadas en JCR, con un índice H de 12 en cuanto a las citas conseguidas por estos artículos. Actualmente tiene 3 sexenios de investigación a nivel nacional, y el último de ellos es un sexenio vivo (activo). También posee un sexenio de transferencia en la única convocatoria abierta hasta ahora por el Ministerio (2019).

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *