Curva Fin Bloque
NOTICIAS 31 MARZO, 2021

Traducción automática de Pangeanic seleccionada como herramienta principal para un Europeana multilíngüe

Traducción automática de Pangeanic seleccionada como herramienta  principal para un Europeana multilíngüe

CEF elige el proyecto Europeana Translate para que la plataforma ECO (traducción automática, anonimización, etc.) de Pangeanic traduzca contenidos y metadatos de más de 25 millones de registros disponibles en la biblioteca digital europea.

En el año 2000 se pone en marcha la preservación del patrimonio digital de la Comunidad Europea, que desemboca en Europeana. La digitalización de millones de documentos aportados por reconocidas instituciones culturales de los 27 estados de la Unión Europea establece el objetivo de facilitar el acceso al patrimonio cultural y científico europeo.

A día de hoy, la plataforma está accesible en 30 idiomas de la comunidad cultural Europeana: inglés, español, alemán, francés, portugués, bosnio, búlgaro, catalán, checo, danés, eslovaco, esloveno, estonio, finés, griego, neerlandés, húngaro, irlandés, islandés, italiano, letón, lituano, maltés, noruego, polaco, rumano, ruso, sueco, ucraniano y vasco. Y recoge más de 25 millones de documentos en 45 idiomas diferentes.

La biblioteca digital europea contiene más de 25 millones de registros a traducir

Es por esto, por lo que nace Europeana Translate. Con el objetivo de dar acceso a todo este acervo cultural y eliminar las barreras del idioma de origen, este proyecto tiene como finalidad conectar las infraestructuras de servicios digitales de la plataforma con las DSI de traducción automática.

Como resultado, el proyecto traducirá los metadatos de estos millones de registros disponibles en Europeana al inglés y los enviará de vuelta a la plataforma de servicios básicos de Europeana como enriquecimientos.

Pangeanic como socio tecnológico del proyecto, liderará la reutilización de su experiencia en personalización de motores de traducción automática del proyecto previo NTEU para Administraciones Públicas europeas desarrollados por su división tecnológica, PangeaMT . El objetivo del proyecto es conseguir traducciones de los metadatos y contenidos culturales con un KPI cercano a la paridad humana (90%), el cual será verificado por los propios gestores de contenido nacional y anotadores. Esto permitirá traducir cientos de millones de palabras de modo escalable en el futuro y garantizar que el contenido cultural europeo esté disponible.

La biblioteca digital europea contiene más de 25 millones de registros a traducirLos motores de traducción automática de Pangeanic, traducirán documentos de más de 45 idiomas distintos

Como profesionales de las tecnologías del lenguaje, Pangeanic trabaja a diario en la implementación de herramientas de procesamiento del lenguaje que faciliten la estructuración de datos para que humanos o máquinas extraigan información accionable. Estas herramientas permiten a empresas e instituciones de todos los sectores (legal, financiero, cultural o turístico, entre otros muchos) mejorar sus servicios al adquirir mayores conocimientos, así como ahorrar recursos y tiempo en la gestión de sus proyectos.

La tecnología Deep Adaptative para la traducción automática, permite la clonación de motores que aprenden de contenidos previamente generados por el usuario o similares y que imitan el vocabulario y estilo. Cada nivel de aprendizaje crea rutinas profundas de aprendizaje y ponderación de datos que permiten a estos motores ser una herramienta fundamental para aquellos usuarios que tengan una terminología específica y/o grandes necesidades de generación o procesamiento de contenidos en idiomas.

Esta tecnología ayudará a Europeana, que se encuentra en su 4º Ciclo DSI, a superar las barreras lingüísticas y poder ofrecer a los ciudadanos e instituciones europeas el acceso a su contenido según sus necesidades multilingües.

Este proyecto se enmarca dentro de la apuesta europea de convertirse en una de las economías más competitivas y dinámicas basadas en el conocimiento. A golpe de clic, pone a disposición del mundo un fondo cultural que incluye libros, pinturas, películas, material sonoro, mapas, periódicos, así como otro tipo de archivos de gran valor que, en breve podremos disfrutar y entender sin límites.