Tres estudiantes de doctorado de la UPC-ESEIAAT, premiados por la RAE por un algoritmo que identifica neologismos tecnológicos

+
Descargar

De izquierda a derecha, Pol Fontanes, Eva Maria Urbano y Víctor Martínez, con sendos diccionarios de la RAE

Tres estudiantes de doctorado de la Escuela Superior de Ingenierías Industrial, Aeroespacial i Audiovisual de Terrassa (ESEIAAT) de la UPC han diseñado un algoritmo de detección automática de neologismos tecnológicos. Con este sistema han ganado el segundo premio de la hackathon 'Neologismos y tecnicismos en el ámbito energético y medioambiental', organizado por la Real Academia de la Lengua Española (RAE) y la Fundación Endesa.

17/06/2021

Los doctorandos de la Escuela Superior de Ingenierías Industrial, Aeroespacial y Audiovisual de Terrassa (ESEIAAT) de la Universitat Politècnica de Catalunya · BarcelonaTech (UPC) Pol Fontanes, del Lightning Research Group (LRG) de la UPC, y Víctor Martínez y Eva María Urbano, ambos del grupo de investigación Motion Control and Industrial Applications (MCIA), han sido galardonados por su proyecto Algoritmo de Detección Automática de Neologismos (ADAN). El premio, dotado con 1.500 euros, lo han ganado en la hackathon 'Neologismos y tecnicismos en el ámbito energético y medioambiental', organizada el pasado mes de mayo por la Real Academia de la Lengua Española y la Fundación Endesa, y en la que participaron por vía telemática más de 400 personas. El reto, que forma parte del proyecto Lengua Española e Inteligencia Artificial (LEIA) de la RAE, consistía en proponer, en un tiempo récord de 24 horas, ideas y proyectos de inteligencia artificial para el estudio de neologismos y tecnicismos en el sector energético y medioambiental.

Los trabajos de los participantes tenían que resolver cuestiones como por ejemplo cuáles son las palabras de uso más reciente en el sector, qué tecnicismos se utilizan, cuáles han pasado ya al uso más general, qué extranjerismos son los más frecuentes o si existen alternativas en español a estos extranjerismos. La propuesta de los estudiantes de doctorado Pol Fontanes, Víctor Martínez y Eva María Urbano, de la ESEIAAT, ha sido valorada por el jurado del evento “por el grado de finalización, la originalidad, la exhaustividad, la automaticidad y la dificultad técnica de las herramientas del proyecto”, así como "por la viabilidad, el diseño y la usabilidad de las mismas". Pol Fontanes cursa el doctorado en Ingeniería Eléctrica, mientras que Víctor Martínez y Eva María Urbano cursan el doctorado en Ingeniería Electrónica.

ADAN
El sistema ADAN se basa en la utilización de algoritmos de inteligencia artificial y big data para procesar textos e identificar las palabras susceptibles de ser neologismos. Para conseguirlo, ADAN utiliza técnicas llamadas de Natural Language Processing (NLP) con las que es capaz de analizar morfológica, sintáctica y semánticamente los textos, para buscar los neologismos y los extranjerismos, cuyos significados son inferidos por el contexto en caso de ser desconocidos.

ADAN trabaja sobre un corpus de recientes publicaciones científicas en español en el ámbito de la energía y el medioambiente, así como artículos divulgativos publicados en la prensa especializada del sector. De esta manera, el sistema capta la aparición de estos nuevos términos tan pronto como éstos entran en uso y, ademàs, realiza la trazabilidad de la frecuencia de aparición del término. Tal y como explica Eva María Urbano, "los algoritmos que hemos utilizado parten de consultas a bases de conocimiento y herramientas de traducción, que deducen si las palabras identificadas en primera instancia como neologismos son ya ampliamente aceptadas en español o, por el contrario, se trata de anglicismos o tecnicismos, de los que se han de proponer alternativas en español o bien analizar su significado según el contexto"

Urbano añade que "antes de empezar a trabajar, la RAE nos hizo ver la importancia de generar estrategias inteligentes para asegurar un entendimiento correcto entre el la máquina y la persona; así podremos avanzar hacia la integración de la tecnología sin dejar de lado la riqueza del lenguaje".

El algoritmo ha sido diseñado para el ámbito de la energía y el medioambiente, pero podría ser útil también en otros campos y otras lenguas.

En palabras de Santiago Muñoz Machado, director de la RAE: “los neologismos son un asunto importante, porque invaden con mucha velocidad el terreno de las ciencias y las nuevas tecnologías [...] Cada día las máquinas hablan más y hay un número mayor de máquinas que hablan y usan un idioma que no es necesariamente el que ha normativizado la RAE, sino que es el idioma que han determinado los fabricantes de dicha tenología”.