Inicio Tecnología. Buscan mejorar traducción automática agregando contexto

Buscan mejorar traducción automática agregando contexto

tecnologia-idioma-traductor

Los algoritmos que utilizan los sistemas de traducción automática funcionan frase por frase, omitiendo el contexto e induciendo a errores, lo que podría evitarse cruzando informaciones contenidas en otras partes del texto, según un equipo de científicos suizos.

Los investigadores han conseguido abrir una nueva vía para mejorar las herramientas de traducción mediante el desarrollo de técnicas que tengan mejor en cuenta el conjunto del texto, explicó hoy en un comunicado el Fondo Nacional Suizo, que financia estos trabajos.

Los sistemas de traducción son utilizados masivamente en el mundo, como lo demuestra el caso de uno de los más conocidos, Google Translate, que cada día traduce 100,000 millones de palabras.

Aunque investigaciones similares se realizan en distintas partes del mundo, los informáticos y lingüistas suizos son los primeros en demostrar que es posible mejorar esos sistemas forzando a la inteligencia artificial a superar el simple ‘frase por frase’ y a buscar otras informaciones útiles en otras partes del texto.

‘Una frase aislada frecuentemente no da suficiente información sobre el contexto para ser traducida correctamente’, según concluye la investigación.

Por ejemplo, los sistemas más sofisticados pueden equivocarse porque existen calificativos que se aplican más frecuentemente a personas que a objetos, y cuando se utilizan para éstos últimos se produce la traducción incorrecta.

Sin embargo, el error podría evitarse si el traductor busca lo que se dice en frases anteriores.

En ciertas parejas de idiomas, como francés-inglés o español-inglés, los pronombres generan errores en las traducciones automáticas en prácticamente la mitad de casos.

Ese nivel de error se reduce a un 30% si el sistema tiene en cuenta informaciones externas a la frase, ubicadas en otros lugares del texto.

La coherencia de los tiempos verbales, la elección de la terminología o los niveles de cortesía son otras áreas problemáticas, que dependen en gran medida del texto en su conjunto, más que de frases tomadas por separado.

Según el equipo de investigación, las técnicas desarrolladas todavía no están listas para ser puestas directamente al servicio del público, pero sí son elementos de gran interés para las empresas activas en este ámbito. EFE