Cargando
Los medios se caracterizan por gestionar una cantidad masiva de información, y por hacerlo tanto en tiempo récord como con una constante necesidad de revisitar material histórico. Por tanto, la correcta precisión y categorización del material audiovisual es una parte crítica para el negocio.
Esta tarea es tan compleja, que existe un grupo de empresas dedicado específicamente a ello: las agencias de prensa. Entre muchas otras labores, las agencias de prensa se encargan de producir grandes cantidades de material de actualidad, que es debidamente catalogado, distribuido y archivado para su posterior consulta. Hacer útil esta enorme y creciente base de conocimiento exige una clasificación y categorización detallada que permita explorarla de forma eficaz en un futuro.
Aunque esto tiene su aplicación a una amplia tipología de documentos, en este caso estamos interesados en el tratamiento de imágenes, en particular en el procesado y etiquetado de fotografías periodísticas.
Las agencias de prensa se enfrentan a la tarea de procesar miles de imágenes a diario, lo cual exige equipos completos de profesionales dedicados a esta tarea. Esto es económicamente costoso, y tiene resultados poco óptimos, ya que es difícil catalogar las imágenes de una forma coherente dado un grupo diverso de trabajadores.
Por ello, surge la necesidad de utilizar herramientas de aprendizaje automático para asistir en este proceso, haciéndolo más robusto, rápido y económico.
El reto en cuestión involucra el análisis de las imágenes desde distintas perspectivas: encuadre, tipo de plano e, incluso, tipos de prendas presentes (joyas, botas, abrigos, gafas de sol, y un larguísimo etcétera) para la empresa Gtres online, líder nacional como plataforma de imágenes y videos de prensa.
El reto presenta distintas dificultades, entre las que encontramos categorías con baja representación, o errores frecuentes de clasificación, debidos tanto a errores humanos (confundir bañador y bikini, asignar etiquetas erróneas, etiquetas que faltan) como a problemas de subjetividad (no es trivial diferenciar entre plano general o de cuerpo entero de forma consistente dado un equipo humano diverso).
Aún así, la funcionalidad de clasificación de imágenes de Foqum es bastante robusta frente a este tipo de problemas siempre que se sigan ciertas prácticas recomendadas. En este sentido, los resultados obtenidos fueron más que satisfactorios con precisiones superiores al 90% tanto para los diferentes tipos de encuadre como para los planos de la fotografía y por encima del 95% en las etiquetas más interesantes para el cliente proporcionando un resultado rápido, fiable y, por si esto fuera poco, consistente.
Como añadido extra se propuso una funcionalidad de análisis capaz de indicar la zona de la fotografía más relevante para cada categoría de clasificación, lo que tiene especial interés si consideramos que no existe ningún tipo de etiquetado en este sentido.
y recuerda lo que no se mide no se puede mejorar.
CONTÁCTANOS RESERVAR SESIÓN DE ESTRATEGIA