Curva Fin Bloque
NOTICIAS 31 MARZO, 2021

Traducción automática de Pangeanic seleccionada como herramienta principal para un Europeana multilíngüe

Traducción automática de Pangeanic seleccionada como herramienta  principal para un Europeana multilíngüe

CEF elige el proyecto Europeana Translate para que la plataforma ECO (traducción automática, anonimización, etc.) de Pangeanic traduzca contenidos y metadatos de más de 25 millones de registros disponibles en la biblioteca digital europea.

En el año 2000 se pone en marcha la preservación del patrimonio digital de la Comunidad Europea, que desemboca en Europeana. La digitalización de millones de documentos aportados por reconocidas instituciones culturales de los 27 estados de la Unión Europea establece el objetivo de facilitar el acceso al patrimonio cultural y científico europeo.

A día de hoy, la plataforma está accesible en 30 idiomas de la comunidad cultural Europeana: inglés, español, alemán, francés, portugués, bosnio, búlgaro, catalán, checo, danés, eslovaco, esloveno, estonio, finés, griego, neerlandés, húngaro, irlandés, islandés, italiano, letón, lituano, maltés, noruego, polaco, rumano, ruso, sueco, ucraniano y vasco. Y recoge más de 25 millones de documentos en 45 idiomas diferentes.

La biblioteca digital europea contiene más de 25 millones de registros a traducir

Es por esto, por lo que nace Europeana Translate. Con el objetivo de dar acceso a todo este acervo cultural y eliminar las barreras del idioma de origen, este proyecto tiene como finalidad conectar las infraestructuras de servicios digitales de la plataforma con las DSI de traducción automática.

Como resultado, el proyecto traducirá los metadatos de estos millones de registros disponibles en Europeana al inglés y los enviará de vuelta a la plataforma de servicios básicos de Europeana como enriquecimientos.

Pangeanic como socio tecnológico del proyecto, liderará la reutilización de su experiencia en personalización de motores de traducción automática del proyecto previo NTEU para Administraciones Públicas europeas desarrollados por su división tecnológica, PangeaMT . El objetivo del proyecto es conseguir traducciones de los metadatos y contenidos culturales con un KPI cercano a la paridad humana (90%), el cual será verificado por los propios gestores de contenido nacional y anotadores. Esto permitirá traducir cientos de millones de palabras de modo escalable en el futuro y garantizar que el contenido cultural europeo esté disponible.

La biblioteca digital europea contiene más de 25 millones de registros a traducirLos motores de traducción automática de Pangeanic, traducirán documentos de más de 45 idiomas distintos

Como profesionales de las tecnologías del lenguaje, Pangeanic trabaja a diario en la implementación de herramientas de procesamiento del lenguaje que faciliten la estructuración de datos para que humanos o máquinas extraigan información accionable. Estas herramientas permiten a empresas e instituciones de todos los sectores (legal, financiero, cultural o turístico, entre otros muchos) mejorar sus servicios al adquirir mayores conocimientos, así como ahorrar recursos y tiempo en la gestión de sus proyectos.

La tecnología Deep Adaptative para la traducción automática, permite la clonación de motores que aprenden de contenidos previamente generados por el usuario o similares y que imitan el vocabulario y estilo. Cada nivel de aprendizaje crea rutinas profundas de aprendizaje y ponderación de datos que permiten a estos motores ser una herramienta fundamental para aquellos usuarios que tengan una terminología específica y/o grandes necesidades de generación o procesamiento de contenidos en idiomas.

Esta tecnología ayudará a Europeana, que se encuentra en su 4º Ciclo DSI, a superar las barreras lingüísticas y poder ofrecer a los ciudadanos e instituciones europeas el acceso a su contenido según sus necesidades multilingües.

Este proyecto se enmarca dentro de la apuesta europea de convertirse en una de las economías más competitivas y dinámicas basadas en el conocimiento. A golpe de clic, pone a disposición del mundo un fondo cultural que incluye libros, pinturas, películas, material sonoro, mapas, periódicos, así como otro tipo de archivos de gran valor que, en breve podremos disfrutar y entender sin límites.

Dónde estamos

Europa

Valencia

Oficinas centrales Pangeanics

Av. Cortes Valencianas, 26-5,

Ofi 107

46015 Valencia (Spain)

(+34) 96 333 63 33
info@pangeanic.com

Londres

Flat8, 279 Church Road,
Crystal Palace
SE19 2QQ
United Kingdom
+44 203 5400 256

london@pangeanic.net

Madrid

Atrium
Castellana 91
Madrid 28046
Spain
(+34) 91 326 29 33
info@pangeanic.com

USA

Boston

One Boston Place
Suite 2600
Boston MA 02108
(617) 621-4084
boston@pangeanic.com

Nueva York

228 E 45TH St Rm 9E
10017-3337 New York, NY

info@pangeanic.com  

Asia

Hong Kong

21st Floor, CMA Building
64 Connaught Road Central
Hong Kong
Toll Free: +852 2157 3950
info@pangeanic.hk

Tokio

Ogawa Building 3F

3-37 Kanda Sakuma-cho

Chiyoda-ku, Tokyo

101-0025

tokyo@pangeanic.net

Shanghai

Tomson Commercial Building,
Room 316-317
710 Dong Fang Road
Pu Dong, Shanghai 200122, China

shanghai@pangeanic.net