{"id":6825,"date":"2024-08-09T11:24:12","date_gmt":"2024-08-09T09:24:12","guid":{"rendered":"https:\/\/foqum.io\/blog\/?p=6103"},"modified":"2025-11-18T15:35:50","modified_gmt":"2025-11-18T14:35:50","slug":"proyecto-toolkit-de-resumizacion-titulizacion-parafrasis","status":"publish","type":"post","link":"https:\/\/foqum.io\/es\/proyecto-toolkit-de-resumizacion-titulizacion-parafrasis\/","title":{"rendered":"Proyecto: Toolkit de resumizaci\u00f3n, titulizaci\u00f3n autom\u00e1tica y par\u00e1frasis de contenido multicanal basado en modelos de deep learning"},"content":{"rendered":"<style>\/*! elementor - v3.23.0 - 05-08-2024 *\/\n.elementor-heading-title{padding:0;margin:0;line-height:1}.elementor-widget-heading .elementor-heading-title[class*=elementor-size-]>a{color:inherit;font-size:inherit;line-height:inherit}.elementor-widget-heading .elementor-heading-title.elementor-size-small{font-size:15px}.elementor-widget-heading .elementor-heading-title.elementor-size-medium{font-size:19px}.elementor-widget-heading .elementor-heading-title.elementor-size-large{font-size:29px}.elementor-widget-heading .elementor-heading-title.elementor-size-xl{font-size:39px}.elementor-widget-heading .elementor-heading-title.elementor-size-xxl{font-size:59px}<\/style>\n<p>Proyecto financiado por la <b>convocatoria de ayudas 2021<\/b> destinadas a proyectos de investigaci\u00f3n y desarrollo en <b>inteligencia artificial<\/b> y otras tecnolog\u00edas digitales y su integraci\u00f3n en las cadenas de valor.\t\t<\/p>\n<p>Tareas relevantes y aparentemente sencillas, como generar un resumen de un peque\u00f1o texto, permanec\u00edan inalcanzables hasta hace pocos a\u00f1os. A medida que ha avanzado el estado del arte, no s\u00f3lo hemos podido enfrentarnos a estos problemas esenciales, sino que hemos ido m\u00e1s all\u00e1 tratando de controlar el estilo de los generadores de texto, la par\u00e1frasis de documentos, etc.<\/p>\n<p>Tambi\u00e9n con textos hemos trabajado en un problema a\u00fan m\u00e1s fundamental, como es la extracci\u00f3n de texto de los documentos (OCR). Aunque el reto est\u00e1 esencialmente superado para la extracci\u00f3n de texto en bruto, sigue siendo un problema interesante la extracci\u00f3n de informaci\u00f3n estructurada o semi-estructurada. En particular, hemos desarrollado un flujo automatizado para entrenamiento de modelos de extracci\u00f3n de informaci\u00f3n en documentos semi-estructuados que alcanza rendimientos similares a ChatGPT4 por una fracci\u00f3n del coste y tiempo de inferencia.<\/p>\n<p>\t\t\tUn paso fundamental\u2014y muchas veces invisible\u2014en cualquier soluci\u00f3n de IA es el procesamiento y simplificaci\u00f3n de los datos.\t\t<\/p>\n<p>M\u00e1s all\u00e1 del texto se ha trabajado tambi\u00e9n con imagen, donde se ha constatado un avance significativo del estado del arte hacia los grandes modelos de lenguaje multimodales. No obstante, no hay que olvidar que en ciertos casos los LLM no son una soluci\u00f3n, por motivos de privacidad, conexi\u00f3n o rendimiento. En estos casos muchas veces es necesario llevar al algoritmo f\u00edsicamente hasta su punto de aplicaci\u00f3n (edge-computing) y es preciso recurrir a t\u00e9cnicas m\u00e1s creativas.<\/p>\n<p>Finalmente, tambi\u00e9n se trabajaron algoritmos de procesamiento de audio. La transcripci\u00f3n es fundamental para poder aplicar toda la potencia de los algoritmos de texto cuando la fuente de datos son audios o v\u00eddeos. Una vez m\u00e1s el avance de los Transformers ha sido clave en esta \u00e1rea, donde tambi\u00e9n se ha tratado el caso de entornos ruidosos o el problema de la asignaci\u00f3n de hablantes o diarizaci\u00f3n.<\/p>\n<style>\/*! elementor - v3.23.0 - 05-08-2024 *\/\n.elementor-widget-image{text-align:center}.elementor-widget-image a{display:inline-block}.elementor-widget-image a img[src$=\".svg\"]{width:48px}.elementor-widget-image img{vertical-align:middle;display:inline-block}<\/style>\n<p>\t\t\t\t\t\t\t\t\t\t<img decoding=\"async\" width=\"300\" height=\"200\" src=\"https:\/\/foqum.io\/wp-content\/uploads\/2024\/08\/sound-4872773_640-300x200.jpg\" alt=\"mezcladora de sonido\" srcset=\"https:\/\/foqum.io\/blog\/wp-content\/uploads\/2024\/08\/sound-4872773_640-300x200.jpg 300w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2024\/08\/sound-4872773_640.jpg 640w\" sizes=\"(max-width: 300px) 100vw, 300px\" title=\"\">\t\t\t\t\t\t\t\t\t\t\t\t\t<\/p>\n<p>Todo este trabajo ha generado una importante base de conocimiento y ha abierto oportunidades comerciales. Sin embargo, el verdadero valor de este proyecto ha sido precisamente poder dar cohesi\u00f3n y modularidad a todos estos algoritmos mediante una Plataforma que facilita el despliegue de APIs, la creaci\u00f3n de demos para comerciales, la documentaci\u00f3n y la monitorizaci\u00f3n de errores y rendimiento de los servicios.<\/p>\n<p>\t\t\t\t\t\t\t\t\t\t\t\t\t<img decoding=\"async\" width=\"342\" height=\"122\" src=\"https:\/\/foqum.io\/wp-content\/uploads\/2024\/08\/redes_sm.png\" alt=\"Logo de RED.ES\" srcset=\"https:\/\/foqum.io\/blog\/wp-content\/uploads\/2024\/08\/redes_sm.png 342w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2024\/08\/redes_sm-300x107.png 300w\" sizes=\"(max-width: 342px) 100vw, 342px\" title=\"\"><br \/>\n\t\t\t\t\t\t\t\t\t\t\t\t\t<img decoding=\"async\" width=\"1024\" height=\"246\" src=\"https:\/\/foqum.io\/wp-content\/uploads\/2024\/08\/MTDFP.Bis_.Gob_-1024x246.jpg\" alt=\"Logo de Ministerio para la Tranformaci\u00f3n Digital y la Funci\u00f3n P\u00fablica\" srcset=\"https:\/\/foqum.io\/blog\/wp-content\/uploads\/2024\/08\/MTDFP.Bis_.Gob_-1024x246.jpg 1024w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2024\/08\/MTDFP.Bis_.Gob_-300x72.jpg 300w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2024\/08\/MTDFP.Bis_.Gob_-768x184.jpg 768w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2024\/08\/MTDFP.Bis_.Gob_-1536x369.jpg 1536w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2024\/08\/MTDFP.Bis_.Gob_-2048x491.jpg 2048w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" title=\"\"><br \/>\n\t\t\t\t\t\t\t\t\t\t\t\t\t<img decoding=\"async\" width=\"1024\" height=\"576\" src=\"https:\/\/foqum.io\/wp-content\/uploads\/2024\/08\/LOGO-COLOR-1024x576.png\" alt=\"Logo del Plan de Recuperaci\u00f3n, Transformaci\u00f3n y Resiliencia\" srcset=\"https:\/\/foqum.io\/blog\/wp-content\/uploads\/2024\/08\/LOGO-COLOR-1024x576.png 1024w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2024\/08\/LOGO-COLOR-300x169.png 300w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2024\/08\/LOGO-COLOR-768x432.png 768w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2024\/08\/LOGO-COLOR-1536x864.png 1536w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2024\/08\/LOGO-COLOR.png 1920w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" title=\"\"><br \/>\n\t\t\t\t\t\t\t\t\t\t\t\t\t<img decoding=\"async\" width=\"1024\" height=\"246\" src=\"https:\/\/foqum.io\/wp-content\/uploads\/2024\/08\/EN_Funded_by_the_European_Union_RGB_POS-1024x246.png\" alt=\"Logo de Fondos Europeos\" srcset=\"https:\/\/foqum.io\/blog\/wp-content\/uploads\/2024\/08\/EN_Funded_by_the_European_Union_RGB_POS-1024x246.png 1024w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2024\/08\/EN_Funded_by_the_European_Union_RGB_POS-300x72.png 300w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2024\/08\/EN_Funded_by_the_European_Union_RGB_POS-768x184.png 768w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2024\/08\/EN_Funded_by_the_European_Union_RGB_POS-1536x368.png 1536w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2024\/08\/EN_Funded_by_the_European_Union_RGB_POS-2048x491.png 2048w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" title=\"\"><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Proyecto financiado por la convocatoria de ayudas 2021 destinadas a  [&#8230;]<\/p>\n","protected":false},"author":3,"featured_media":7447,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"footnotes":""},"categories":[128],"tags":[],"class_list":["post-6825","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-foqum"],"acf":[],"_links":{"self":[{"href":"https:\/\/foqum.io\/es\/wp-json\/wp\/v2\/posts\/6825","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/foqum.io\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/foqum.io\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/foqum.io\/es\/wp-json\/wp\/v2\/users\/3"}],"replies":[{"embeddable":true,"href":"https:\/\/foqum.io\/es\/wp-json\/wp\/v2\/comments?post=6825"}],"version-history":[{"count":0,"href":"https:\/\/foqum.io\/es\/wp-json\/wp\/v2\/posts\/6825\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/foqum.io\/es\/wp-json\/wp\/v2\/media\/7447"}],"wp:attachment":[{"href":"https:\/\/foqum.io\/es\/wp-json\/wp\/v2\/media?parent=6825"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/foqum.io\/es\/wp-json\/wp\/v2\/categories?post=6825"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/foqum.io\/es\/wp-json\/wp\/v2\/tags?post=6825"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}