Pangeanic fue la primera empresa de traducción del mundo en hacer uso comercial del desarrollo europeo Moses, siendo publicado por la Asociación para la Traducción Automática en las Américas (AMTA) en 2010 y el proyecto Euromatrixplus de la Unión Europea.

Docenas de corporaciones, empresas y empresas de traducción se han beneficiado de un enfoque flexible que tiene al usuario como centro y que proporciona los más altos niveles de control, customización e independencia en la gestión de la traducción automática a los usuarios. Pangeanic ha desarrollado y usado la traducción automática en numerosas aplicaciones y ha creado conectores para herramientas de traducción como MemoQ o SDL Studio. También ha informado de exitosos casos de uso de muchos de sus clientes en eventos industriales como Localization World Barcelona 2011Localization World Paris 2012Localization World London 2013, además de numerosos congresos de TAUS en Europa, Estados Unidos y Japón, META Forum Berlin 2013 y la Japan Translation Federation.

Pangeanic también ha sido uno de los mayores donantes a TAUS de datos bilingües para en entrenamiento de motores estadísticos, lo que a su vez nos proporcionó acceso a millones de palabras como corpus de entrenamiento para nuestros propios motores. Esto mejoró e hizo crecer la primera plataforma PangeaMT y dio a nuestro equipo la oportunidad de experimentar con datos de diversos dominios lingüísticos. La traducción automática se convirtió en parte de la cultura de nuestra en empresa desde 2009 y desde entonces los servicios de traducción automática a empresas e incluso a otras agencias de traducción se han convertido en parte integral de la gama de servicios de Pangeanic. Desde 2012 a 2016, Pangeanic ha formado parte de una acción Marie Curie de la Unión Europea, el EXPERT Project, avanzando el estado del arte, investigando y mejorando sus tecnologías con jóvenes y expertos investigadores.

PangeaMT es la división independiente de tecnología de traducción de Pangeanic con un claro enfoque en Traducción automática (TA) personalizada, específica a cada dominio. La versión actual de la plataforma es la v3. Pangeanic ha desarrollado y utilizado traducción automática para muchas aplicaciones desde que se convirtió en miembro de TAUS y gracias al acceso a millones de palabras como corpus de formación con el que experimentar. La traducción automática se convirtió en parte de la cultura de la empresa desde 2009 y desde entonces los servicios de la traducción automática a corporaciones e incluso otras empresas de la traducción son parte de la gama de servicios de Pangeanic.

FEDER_logoexpert project EU Marie Curie

EuroMatrixplus

HISTORIA

Como empresa de traducción con visión de futuro y buena conocedora de la tecnología, Pangeanic gana un contrato de posedición en 2007 para trabajar para la Comisión Europea como poseditores de la TA. Es en este momento cuando nos familiarizamos con las necesidades de los usuarios institucionales y (re)evaluamos varios productos comerciales de MT que habíamos estado usando.  Pronto decidimos desarrollar nuestra propia tecnología de la traducción automática. Pangeanic fue mencionado como el primer proveedor lingüísticos en hacer uso comercial de Moses en el programa de Desarrollo Marco de la UE euromatrixplus.net (la segunda, más perfeccionada versión de Moses). Desde entonces han seguido muchas presentaciones, premios e implementaciones, y Pangeanic se ha labrado un nombre como empresa líder en la implementación de traducción automática. También comercializa sus servicios de traducción automática en otras áreas más allá de la industria de la traducción y está muy involucrada en dos programas más de I+D de traducción automática en la UE, EXPERT y Casmacat (grupo de usuarios). ENFOQUE Comenzamos como entusiastas seguidores del paradigma estadístico de la traducción automática. Esto funcionó muy bien en varias lenguas relacionadas (lenguas romances e inglés, alemán y escandinavas). Sin embargo, nuestras relaciones con la industria japonesa pronto proporcionaron peticiones de añadir japonés y chino a nuestra cartera de servicios. En 2011, Pangeanic desarrolló servicios de la traducción automática híbridos que se incluyeron como parte de las funcionalidades del sistema.

CARACTERÍSTICAS

Pese a nuestra preferencia por Moses, hemos podido resolver muchas de las limitaciones de Moses para adecuarlo a las necesidades de la industria de la traducción: nuestras soluciones van más allá de TA basada en texto y pueden aceptar entradas y producir salidas en estándares de la industria como TMX y XLIFF. PangeaMT proporciona acceso por API a otras plataformas de traducción de modo que Ud no tiene que cambiar su entorno de traducción pero sí beneficiarse de poder añadir sus futuras traducciones en un ciclo de reentrenamiento virtuoso. Al emplear estándares abiertos, no tendrá que comprar un costoso software de memorias de traducción otra vez. Nuestras soluciones le evitan quedar encadenado en caras actualizaciones año tras año. Otro avance de PangeaMT es nuestro analizador de etiqueta en línea. PangeaMT trata las etiquetas muy eficientemente. Los sistemas de traducción automática estadística (según provienen de versiones de fuentes abiertas) suelen producir textos plano en la salida porque éste es también el formato que procesan. Sin embargo, estamos orgullosos de ver soluciones PangeaMT en uso y adaptadas a los requerimientos más exigentes de la industria del idioma. Hemos centrado nuestros esfuerzos en el desarrollo de motores de traducción automática estadística capaces de manejar la codificación de etiquetas típica de otros formatos de contenido utilizados en entornos de producción de localización.

Gracias a este analizador, PangeaMT puede identificar etiquetas sin intentar traducirlos y también los coloca en el texto resultante. Un marcador de posición en línea actúa primero copiando y transfiriendo toda el XML e la información de código a un módulo independiente. El motor de traducción hace su trabajo y a continuación coloca la etiqueta en el segmento traducido. En el momento de su lanzamiento, nuestro analizador de etiquetas constituyó una innovación bien muy por encima del nivel actual de madurez de los conocidos sistemas SMT. Seguimos aprendiendo y mejorando con cada desarrollo encargado por un cliente nuevo o existente y la combinación de idiomas. Por lo tanto permanecemos abiertos en cuanto a aplicar nuevas técnicas de hibridación, incluso reglas ad hoc, que investigamos y aplicamos nosotros mismos o desarrollamos conjuntamente con nuestros clientes. Somos conscientes del hecho de que para algunas combinaciones de idiomas será necesario recurrir a algunas técnicas con información lingüística que formarán parte de las fases de pre- o post- procesamiento.

Un reordenamiento de palabra y frase en la salida de TA no es una meta fácil de conseguir, sobre todo cuando las lenguas implicadas no están estrechamente vinculadas desde un punto de vista de familia lingüística, o cuando uno de los dos idiomas tiene un orden de palabras (WO) muy flexible y difícil para la TA. Algunos procedimientos de fijación específicos al idioma pueden resultar de utilidad. En otros casos, puede ser útil usar una lengua como pivote para entrenar a los motores en los idiomas que no son cercanos. Pueden emplearse éstas y otras técnicas o tomarse como base para expandir nuestra cartera de soluciones PangeaMT. Visite nuestra web de la division de traducción automática para descubrir más sobre PangeaMT.