Más cerca del traductor automático universal

+
Descargar

La investigadora Marta Ruiz Costa-jussà

La investigadora de la UPC Marta Ruiz Costa-jussà publica un artículo en la revista 'Nature Machine Intelligence' en el que repasa los avances recientes en el campo de la traducción automática desde una aproximación neuronal.

11/06/2021

Disponer de un traductor universal que pueda traducir cualquier lengua escrita, hablada o signada de manera transparente e inclusiva. Este es el ambicioso objetivo de la investigación en el campo de la traducción automática, que desde un enfoque neuronal se está abordando a partir de una estructura compartida que actúa como traductor único, un tipo de idioma intermedio hacia el que y a partir del cual pasan todas las traducciones.

En el artículo 'Towards universal translation', publicado recientemente en la revista 'Nature Machine Intelligence', la investigadora Marta Ruiz Costa-jussà, del Departamento de Ciencia de la Computación de la Universitat Politècnica de Catalunya · BarcelonaTech (UPC), y miembro del Intelligent Data Science and Artificial Intelligence Research Center (IDEAI-UPC) y del Centro de Tecnologías y Aplicaciones del Lenguaje y el Habla (TALP), analiza los resultados de la investigación reciente desde esta aproximación y constata los retos pendientes. 

Por una parte, aunque los sistemas de traducción actuales cubren los idiomas de casi el 90 % de la población mundial, tan solo alcanzan una pequeña parte de las más de 7.000 lenguas habladas en el mundo, que continúan estando infrarrepresentadas en estos sistemas, con el consecuente riesgo de desaparecer.

Por otra parte, los sistemas de traducción automática presentan limitaciones en relación con las lenguas no escritas, ya que dependen en gran medida de los textos digitalizados. Por lo tanto, para las lenguas orales y de signos se requiere de la multimodalidad del sistema de traducción automática.

Finalmente, la investigadora señala que los sistemas actuales no presentan suficiente robustez, equidad y transparencia de los datos. De hecho, “datos desequilibrados con una elevada presencia de hombres sobre mujeres, entre otros desequilibrios sociales, guían nuestros sistemas, que han demostrado amplificar los estereotipos”.

Marta R. Costa-jussà concluye que es posible avanzar hacia una herramienta que ofrezca traducción en tiempo real, una herramienta “capaz de reducir los conflictos internacionales y mejorar la comunicación global y las relaciones internacionales”.

Reconocimiento ERC Starting Grant por el proyecto LUNAR
Marta Ruiz Costa-jussà fue distinguida en 2020 con una ayuda Starting Grant del European Research Council (ERC) por explorar nuevos métodos de traducción automática de texto y voz. Con el proyecto Lifelong UNiversal lAnguage Representation – LUNAR, está estudiando un sistema de traducción automática más eficiente que los actuales y que integre las lenguas minoritarias.

La investigadora estudia cómo mejorar los sistemas neuronales en los que se basa la traducción automática actualmente para solucionar el problema de los idiomas infrarrepresentados. Con el establecimiento de codificadores y descodificadores específicos para cada idioma, se pretende que la traducción desde el lenguaje intermedio sea lo más rica y completa posible en cualquier idioma.

Además, el proyecto LUNAR hará posible que este sistema también funcione en la traducción automática de voz. En cuanto a los sesgos que todavía presentan estos sistemas, el reto consiste en conseguir algoritmos que aprendan de manera equitativa, entrenándolos con datos actualizados y que no presenten estereotipos.