Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Informática# Computación y lenguaje

Desafíos de la Traducción Automática en Metáforas

Examinando las dificultades de traducir lenguaje metafórico en la traducción automática.

― 7 minilectura


Desafíos de Traducción deDesafíos de Traducción deMetáforasfigurado.traducción automática con el lenguajeInvestigando las dificultades de la
Tabla de contenidos

La traducción automática (TA) ha avanzado un montón con la ayuda de modelos computacionales avanzados. La gente a menudo compara estas traducciones con las hechas por humanos o les da puntuaciones basándose en lo que dicen expertos humanos. La mayoría de los métodos actuales para verificar la Calidad de las traducciones se centran en qué tan fluidas y precisas son. Sin embargo, muchos no miran de cerca qué tan bien manejan expresiones figurativas, como las Metáforas.

En este artículo, vamos a profundizar en cómo la TA maneja el lenguaje metafórico. Vamos a hablar de los problemas que surgen al traducir metáforas y sugerir formas de evaluar mejor la calidad de la traducción cuando se trata de este tipo de expresiones.

¿Qué es una metáfora?

Las metáforas son comunes en el habla cotidiana. Nos ayudan a comunicar ideas complejas de manera vívida. En lingüística, una metáfora es cuando una cosa se describe en términos de otra. Por ejemplo, en la oración "El grito atravesó la noche," "atravesó" no significa cortar literalmente, sino que sugiere un sonido agudo que rompe la calma de la noche.

Una gran parte de nuestro idioma cotidiano incluye términos metafóricos. Los estudios muestran que las metáforas ayudan a moldear nuestros pensamientos y decisiones. A menudo funcionan a través de los idiomas, lo que significa que ideas metafóricas similares pueden aparecer sin importar el idioma que se use. Por ejemplo, en inglés, la palabra "pierce" se puede igualar a la palabra china "穿透," que también tiene un significado metafórico relacionado con el sonido.

Desafíos en la traducción de metáforas

Traducir metáforas puede ser complicado porque diferentes idiomas tienen diferentes formas de expresar la misma idea. Por ejemplo, en chino, una persona borracha podría compararse con alguien que se ha caído en el barro. En inglés, ese mismo estado podría describirse como ver elefantes rosas. Tales diferencias pueden causar problemas significativos al traducir expresiones metafóricas.

Los lingüistas han estado prestando más atención a las metáforas y su importancia en diversas tareas, como la traducción, la escritura creativa y la conversación. Sin embargo, la traducción de metáforas a menudo se pasa por alto en la TA porque no hay suficientes recursos o datos disponibles para una tarea así.

Para llenar este vacío, sugerimos un método llamado MMTE, que significa Evaluación de Traducción Automática Metafórica. Este método busca investigar los desafíos involucrados en la traducción del lenguaje metafórico.

Nuestras contribuciones

  1. Corpus: Creamos el primer corpus de evaluación de traducción de metáforas multilingüe que se centra en inglés y chino/italiano.

  2. Marco de Evaluación Humana: Desarrollamos un nuevo marco para la evaluación humana que examina qué tan bien se realizan las traducciones metafóricas.

  3. Fundamentos Teóricos: Esbozamos las dificultades de traducir metáforas. Nuestro marco toma en cuenta diversas perspectivas e idiomas.

Evaluando el lenguaje metafórico

Las metáforas juegan un papel clave en cómo expresamos emociones y entendemos ideas. Nuestro objetivo es mejorar cómo evaluamos la calidad de las traducciones cuando hay metáforas involucradas. Proponemos un conjunto de nuevas métricas para este propósito, enfocándonos específicamente en el lenguaje metafórico.

La evaluación incluye cuatro áreas clave:

  1. Equivalencia Metafórica: ¿Qué tan bien coincide la metáfora traducida con la original?

  2. Emoción: ¿La traducción transmite el mismo peso emocional que la metáfora original?

  3. Autenticidad: ¿La metáfora traducida suena natural en el idioma de destino?

  4. Calidad: ¿Qué tan bien se ha realizado la traducción en general?

Nuestro objetivo es establecer un estándar para evaluar qué tan efectivamente se traducen las metáforas.

Creando el conjunto de datos

Para construir nuestro conjunto de datos, recopilamos oraciones que contienen metáforas y sus traducciones. Usamos el conjunto de datos MOH, que incluye una selección de oraciones metafóricas y literales. Nuestro conjunto de datos contiene traducciones de modelos de TA populares, incluyendo Google Cloud Translation y GPT-4.

Después de reunir nuestras traducciones, contratamos lingüistas que son hablantes nativos de los idiomas de destino para revisar y anotar estas traducciones. Se centraron en los cuatro criterios de evaluación, lo que nos permitió crear un conjunto de datos completo de traducciones metafóricas y literales.

Proceso de anotación

Nuestro proceso de anotación implica tres pasos principales. Primero, comparamos las oraciones de origen con las traducciones. Luego, evaluamos las traducciones basándonos en los cuatro criterios mencionados anteriormente. Finalmente, traductores profesionales verifican las anotaciones para asegurar precisión.

A través de este proceso, categorizamos las traducciones en tres tipos de equivalencia: equivalencia total, parte de equivalencia y no-equivalencia. También identificamos errores, como malentendidos o errores directos en la traducción.

Luego evaluamos la emoción comparando cuánto se expresa en la metáfora original y cuánto se captura en la traducción. El objetivo es mantener el matiz emocional a través del proceso de traducción.

Métricas automáticas para la evaluación de traducción

Junto con las evaluaciones humanas, introducimos varias métricas automáticas para evaluar la calidad de la traducción. Estas métricas incluyen:

  1. BLEU/ROUGE: Son puntuaciones que miden cuán similar es el texto traducido a las referencias editadas por humanos.

  2. BERTScore: Esta métrica evalúa las traducciones sin necesidad de una referencia exacta y es útil en configuraciones multilingües.

  3. GPT Score: Usamos el modelo GPT-4 para revisar traducciones y proporcionar puntuaciones basadas en los mismos estándares que los anotadores humanos.

Al realizar un análisis exhaustivo, comparamos qué tan bien funcionan diferentes modelos de TA al traducir expresiones metafóricas frente a literales.

Hallazgos sobre la traducción metafórica vs. literal

Nuestros hallazgos sugieren que traducir expresiones metafóricas es significativamente más desafiante que traducir expresiones literales. Aproximadamente el 20% de las expresiones metafóricas se tradujeron mal, con muchas que no lograron transmitir el significado metafórico deseado.

En las traducciones de inglés-chino e inglés-italiano, notamos que las traducciones de expresiones metafóricas consistentemente recibieron puntuaciones más bajas en comparación con las traducciones literales. Sin embargo, cuando las metáforas se tradujeron correctamente, las puntuaciones resultantes mejoraron significativamente. Esto indica que una traducción adecuada de metáforas puede dar resultados satisfactorios.

El rol de la tipología del lenguaje

Otro hallazgo interesante es que la tipología, o estructura, de los idiomas juega un papel en la dificultad de la traducción. Por ejemplo, el par de idiomas inglés-italiano generalmente muestra un mejor rendimiento porque comparten más similitudes estructurales que el inglés-chino.

Sin embargo, esto no siempre es cierto para todos los sistemas de TA. Por ejemplo, ciertas herramientas de traducción comerciales funcionan mejor al traducir del inglés al chino que del inglés al italiano. Creemos que el tamaño de los conjuntos de datos disponibles puede tener un impacto más significativo en la calidad de la traducción que la tipología del idioma por sí sola.

Conclusión y trabajo futuro

MMTE representa un paso significativo para entender cómo se traducen las expresiones metafóricas a través de diferentes idiomas. Nuestros hallazgos tienen implicaciones prácticas para mejorar la calidad de la traducción automática.

También reconocemos varias limitaciones en nuestro trabajo. Por ejemplo, nos centramos principalmente en sistemas de traducción comerciales de última generación en lugar de explorar sistemas menos populares o nuevos. Además, no profundizamos mucho en la tipología del lenguaje, que sigue siendo un área fascinante para futuras investigaciones.

Nuestro objetivo final es contribuir al campo de la lingüística computacional mejorando la calidad y fiabilidad de las traducciones, especialmente cuando se trata de las áreas matizadas del lenguaje figurativo. Al compartir nuestros métodos y hallazgos abiertamente, esperamos fomentar más investigaciones e innovaciones en esta importante área.

Fuente original

Título: MMTE: Corpus and Metrics for Evaluating Machine Translation Quality of Metaphorical Language

Resumen: Machine Translation (MT) has developed rapidly since the release of Large Language Models and current MT evaluation is performed through comparison with reference human translations or by predicting quality scores from human-labeled data. However, these mainstream evaluation methods mainly focus on fluency and factual reliability, whilst paying little attention to figurative quality. In this paper, we investigate the figurative quality of MT and propose a set of human evaluation metrics focused on the translation of figurative language. We additionally present a multilingual parallel metaphor corpus generated by post-editing. Our evaluation protocol is designed to estimate four aspects of MT: Metaphorical Equivalence, Emotion, Authenticity, and Quality. In doing so, we observe that translations of figurative expressions display different traits from literal ones.

Autores: Shun Wang, Ge Zhang, Han Wu, Tyler Loakman, Wenhao Huang, Chenghua Lin

Última actualización: 2024-11-08 00:00:00

Idioma: English

Fuente URL: https://arxiv.org/abs/2406.13698

Fuente PDF: https://arxiv.org/pdf/2406.13698

Licencia: https://creativecommons.org/licenses/by-sa/4.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.

Más de autores

Artículos similares