Més a prop del traductor automàtic universal

+
Descarregar

La investigadora Marta Ruiz Costa-jussà

La investigadora de la UPC Marta Ruiz Costa-jussà publica un article a la revista ‘Nature Machine Intelligence’ en què repassa els avenços recents en el camp de la traducció automàtica des d’una aproximació neuronal.

11/06/2021

Disposar d’un traductor universal que pugui traduir qualsevol llengua escrita, parlada o signada de manera transparent i inclusiva. Aquest és l’ambiciós objectiu de la recerca en el camp de la traducció automàtica, que des d’un enfocament neuronal s’està abordant a partir d’una estructura compartida que actua com a traductor únic, una mena d’idioma intermedi cap al qual i a partir del qual passen totes les traduccions. 

A l’article ‘Towards universal translation’, publicat recentment a la revista 'Nature Machine Intelligence', la investigadora Marta Ruiz Costa-jussà, del Departament de Ciències de la Computació de la Universitat Politècnica de Catalunya · BarcelonaTech (UPC), i membre de l’Intelligent Data Science and Artificial Intelligence Research Center (IDEAI-UPC) i del Centre de Tecnologies i Aplicacions del Llenguatge i la Parla (TALP), analitza el resultats de la recerca recent des d’aquesta aproximació i constata els reptes pendents.

D’una banda, tot i que els sistemes de traducció actuals cobreixen els idiomes de gairebé el 90 % de la població mundial, tan sols abasten una petita part de les més de 7.000 llengües parlades al món, que continuen estant infrarepresentades en aquestes sistemes, amb el conseqüent risc de desaparèixer.

D’altra banda, els sistemes de traducció automàtica presenten limitacions pel que fa a les llengües no escrites, ja que depenen en gran mesura dels textos digitalitzats. Per a les llengües orals i de signes es requereix, doncs, de la multimodalitat del sistema de traducció automàtica.

Finalment, la investigadora assenyala que els sistemes actuals no presenten prou robustesa, equitat i transparència de les dades. De fet, “dades desequilibrades amb una elevada presència d'homes sobre dones, entre d’altres desequilibris socials, guien els nostres sistemes, que han demostrat amplificar els estereotips”.

Marta R. Costa-jussà conclou que és possible avançar cap a una eina que ofereixi traducció en temps real, una eina “capaç de reduir els conflictes internacionals i millorar la comunicació global i les relacions internacionals”.

Reconeixement ERC Starting Grant pel projecte LUNAR
Marta Ruiz Costa-jussà va estar distingida el 2020 amb un ajut Starting Grant de l’European Research Council (ERC) per explorar nous mètodes de traducció automàtica de text i veu. Amb el projecte Lifelong UNiversal lAnguage Representation – LUNAR, està estudiant un sistema de traducció automàtica més eficient que els actuals i que integri les llengües minoritàries.

La investigadora estudia com millorar els sistemes neuronals en què es basa la traducció automàtica actualment per solucionar el problema dels idiomes infrarepresentats. Amb l’establiment de codificadors i descodificadors específics per a cada idioma, es pretén que la traducció des del llenguatge intermedi sigui el més rica i completa possible en qualsevol idioma.

A més, el projecte LUNAR farà possible que aquest sistema també funcioni en la traducció automàtica de veu. Pel que fa als biaixos que encara presenten aquestes sistemes, el repte consisteix a aconseguir algorismes que aprenguin de manera equitativa, entrenant-los amb dades actualitzades i que no presentin estereotips.