Los profesionales de Pangeanic colaboran en esta nueva edición realizando la traducción humana de español, catalán y portugués de los archivos de desarrollo y test para la competición de traducción automática sobre traducción de lenguas similares para la conferencia WMT 2020 que servirán para evaluar los sistemas de traducción automática. Una parte de la conferencia, que viene celebrándose anualmente con puntualidad desde 2006, consiste en competiciones de sistemas de traducción automática desarrollados por universidades o empresas sobre tareas que son retos para estos sistemas. Además, esta competición mundialmente reconocida incluye también, en paralelo, tareas de posedición automática, estimación automática de la calidad de las traducciones y filtrado automático de corpus paralelo. Por otra parte, la conferencia WMT 2020 supone una gran aportación en la publicación de artículos científicos y las descripciones de los sistemas de traducción automática que han competido.

 

Portrait EMNLP2020 conference. Image credit: NASA Portrait EMNLP2020 conference. Image credit: NASA

La cita tendrá lugar en formato online los días 19 y 20 de noviembre, y es uno de los eventos recogidos dentro de la conferencia EMNLP 2020, una de las más importantes a nivel global sobre procesamiento del lenguaje natural (se clasifica como Core A).

Dado el interés de la comunidad por el desafío que supone aprovechar la similitud entre los idiomas para superar los objetivos de calidad en traducción automática, la conferencia WMT 2020 contará por segunda vez con la tarea compartida sobre “Traducción de idiomas similares” para evaluar el rendimiento de los sistemas de traducción de vanguardia en la traducción entre pares de idiomas de la misma familia.

Este año tenemos cinco pares de idiomas similares de tres familias de idiomas diferentes:

  • Traducciones de hindi–marathi de la familia indo-aria.
  • Las traducciones de los idiomas romances español–catalán y español–portugués.
  • Y traducciones eslavas del sur eslovaco–croata y eslovaco–serbio.

Las traducciones se evaluarán en ambas direcciones (por ejemplo, del español al catalán y del catalán al español).

La conferencia EMNLP incluye numerosos workshops, tutoriales, sesiones de demos, pósters y otras especializadas en aprendizaje automático, semántica, diálogo, análisis del sentimiento, extracción de información, generación de resúmenes, reconocimiento de voz, traducción automática, etc. para la presentación de artículos científicos.

La situación de alerta sanitaria internacional y las circunstancias particulares de confinamiento en muchos países no han conseguido desilusionar a los organizadores de grandes eventos que este año 2020 tendrá lugar de manera virtual. Pangeanic sigue colaborando activamente como años anteriores en la investigación y desarrollo de la traducción automática y procesamiento del lenguaje natural, junto a su consolidado equipo tecnológico, en su división PangeaMT. Si bien este año no podremos asistir de manera presencial a las conferencias, sí que presentaremos de manera online 5 artículos.