BLEU

BLEU, acrónimo de Bilingual Evaluation Understudy, es una métrica utilizada para evaluar la calidad de textos traducidos por máquinas en comparación con traducciones humanas. Desarrollado originalmente para medir la efectividad de sistemas de traducción automática, BLEU compara la traducción generada por la máquina con una o varias traducciones de referencia hechas por humanos. Se basa en la coincidencia de frases y palabras, calculando qué tan a menudo las palabras y frases de la traducción automática aparecen en las traducciones de referencia. Aunque proporciona una evaluación rápida y cuantitativa, BLEU es criticado por no capturar completamente la fluidez y la precisión semántica.

¿Qué es BLEU?

¿En qué consiste el método de comparación que utiliza BLEU entre las traducciones generadas y las referencias humanas?

El método de comparación que utiliza BLEU implica contar las coincidencias de frases cortas, generalmente de uno a cuatro palabras (n-gramas), entre la traducción generada por la máquina y las traducciones de referencia hechas por humanos. BLEU evalúa la calidad de la traducción computando la proporción de n-gramas en la traducción automática que también aparecen en las referencias. Además, incluye un factor de penalización por brevedad para evitar favorecer respuestas más cortas que podrían artificialmente coincidir con más n-gramas. Esta comparación proporciona una puntuación cuantitativa que refleja la cercanía de la traducción automática a las traducciones humanas, aunque se centra más en la precisión que en la fluidez o la comprensión global.

¿Cuáles son las ventajas y limitaciones de utilizar BLEU para evaluar la calidad de la traducción automática?

Una ventaja de utilizar BLEU para evaluar la calidad de la traducción automática es su capacidad para proporcionar evaluaciones rápidas y consistentes a gran escala, lo que es útil para comparar y mejorar sistemas de traducción. BLEU es objetivo y fácil de automatizar, lo que facilita la comparación entre diferentes sistemas de traducción.

Sin embargo, BLEU tiene limitaciones significativas. Principalmente, se centra en la precisión de las palabras individuales y las frases cortas, pero no captura bien la fluidez, la gramática, el estilo o el sentido contextual del texto. Además, puede no reflejar adecuadamente la legibilidad o la comprensión semántica total de la traducción, y su eficacia depende de la calidad y variedad de las traducciones de referencia utilizadas.

Volver al glosario

Email: info@foqum.io

Teléfono: +34 675 481 701

C. de Agustín Durán, 24, Local bajo izquierda, 28028 Madrid.

Discovery

DISCOVERY

Plataforma IA

Herramientas Plug & Play

READ
OP2AIM