Diciembre 09
Posted: under Sin categoría.
Mientras se llevaba a cabo la implementación de las distancias y releyendo el documento “Bounded Coordinate System Indexing for Real-Time Video Clip Search” nos dimos cuenta de que la forma de calcular el tamaño de las cajas podía suponer un problema. La caja debe representar al conjunto de puntos, pero si tuviéramos un conjunto de puntos más o menos cercanos unos de otros y un solo punto bastante alejado del resto por cualquier motivo, el tamaño de la caja aumentaría considerablemente debido sólo a este punto y no al conjunto. Por este motivo tiene más sentido utilizar la desviación estándar, de manera que el centro de la caja se calcula como la media de los valores de los puntos y el tamaño en cada dimensión es igual a dos veces la desviación estándar de los puntos en esa dimensión. Evidentemente este cambio afecta al resultado de las distancias propuestas, ya que cambia el tamaño de las cajas. La fórmula de la desviación estándar es la siguiente:
A continuación vamos a ver el ejemplo anterior del post de Noviembre en el que no se usaba la desviación estándar, y cómo quedaría con esta nueva forma de calcular el tamaño de las cajas.
X | Y | ||
Vectores
de características |
Keyframe 1 | 1 | 3 |
Keyframe 2 | 2 | 3 | |
Keyframe 3 | 3 | 1 | |
Keyframe 4 | 3 | 4 | |
Keyframe 5 | 5 | 2 | |
Keyframe 6 | 6 | 4 | |
Media | 3’333 | 2’833 | |
Desviación estándar | 1,862 | 1’169 |
Ejemplo de representación sin utilizar la desviación estandar:
El mismo ejemplo utilizando la desviación estándar:
Una vez implementado el método de comparación con la desviación estándar, había que comprobar que todos los cálculos se hacían correctamente. Para ello lo mejor era utilizar un ejemplo sencillo en el que se comparasen dos vídeos, teniendo sólo en cuenta 3 características y ambos vídeos formados por 5 o 6 vectores, de manera que los calculos se pudiesen hacer a mano y comprobar que todo era correcto. Una vez realizado esto, ya se podía empezar a hacer pruebas con los vídeos deportivos. En estas pruebas se iba a ver el resultados de las tres distancias propuestas por separado, sin combinarlas en una sola distancia, para comprobar la eficacia de cada una y modificarlas en caso necesario. Entonces se realizó la comparación de cada uno de los vídeos con todos los demás, y los resultados en un principio parecían satisfactorios, ya que para cada vídeo, los vídeos de su misma categoría se situaban entre los más parecidos. Sin embargo era demasiado pronto para cantar victoria porque hasta ahora lo que se tenían eran 10 vídeos de cada categoría (balonmano, baloncesto, fórmula 1, fútbol, motociclismo, natación, rugby y tenis), pero dentro de cada categoría los videos son en realidad pequeños trozos de un vídeo más grande, es decir, por ejemplo de un partido de fútbol se habían sacado diez trozos de dos minutos aproximadamente. Esto significa que como los trozos pertenecen al mismo evento, se utlizan las mismas camaras, planos parecidos, etc. y es lógico que haya un gran parecido entre ellos. Entonces es necesario conseguir distintintos videos de cada una de las categorías, que pertenezcan a eventos diferentes, para comprobar si efectivamente los resultados son tan buenos, así que le encargamos de nuevo a Francisco Ruiz que obtenga más vídeos de todas las categorías para seguir haciendo pruebas.
Mientras Francisco se encarga de esta labor, se va a mejorar la forma de mostrar los resultados de las comparaciones. Hasta ahora se mostraban por pantalla o en un fichero de texto, lo que puede valer cuando son pocos vídeos a comparar, pero si el número de vídeos aumente considerablemten se hace difícil interprear los resultados. Así que se ha decidido implementar la salida para obtener un fichero csv, que permita ver los resultados de las comparaciones como una tabla en una hoja de cálculo, pudiendo ordenar los vídeos y ver cuales son los más parecidos según cada una de las distancias.
El proceso de obtención de los nuevos vídeos puede ser un poco largo porque hay que descargar primero los vídeos y luego utilizar las aplicaciones de los proyectos de Antonio Sánchez y de Alberto Aparicio para obtener ficheros con los vectores de características de todos los frames y con los saltos de escena respectivamente. Entonces en lugar de esperar a tener los vídeos de todas las categorías, Francisco me va pasando los ficheros y los vídeos de las distintas categorías a medida que los tenga. En primer lugar me ha pasdo vídeos de fútbol de diferentes eventos, con sus ficheros correspondientes, y lo primero que se ha hecho es obtener de cada uno el fichero con los vectores de características de los keyframes. A continuación se ha probado ha realizar comparaciones entre estos videos nuevos con los que ya se tenían y los resultados parecen empeorar. Ahora, entre los vídeos más parecidos a uno de fútbol, se encuantran algunos de fútbol también pero también se entremezclan bastantes vídeos de otras caegorías. Aun así vamos a esperar a tener más vídeos distintintos del resto de categorías para sacar conclusiones, ya que aprovechando las vacaciones de Navidad, Francisco tiene tiempo para hacer esto.
Comments (0)
Dic 31 2009