El valor médico del análisis del habla
octubre 23, 2015

España destinará 90 millones de euros para promover las tecnologías de la industria de la lengua, especialmente  las tecnologías de procesamiento del lenguaje natural (PLN).

La vicepresidenta, ministra de la presidencia y portavoz del gobierno, Soraya Sáenz de Santamaría, presentó el “Plan de Impulso de las Tecnologías del Lenguaje” en la sede del Instituto Cervantes en Madrid el pasado martes, acto al que asistió Pangeanic como empresa relevante en el desarrollo de tecnologías de traducción automática. Esta importante inversión llevará a cabo durante el periodo 2016-2020 y es parte de la Agenda Digital de España. Se invertirán 14 millones de euros para el año que viene. El gobierno español hizo el anuncio oficial en su página web.

La estrategia presenta un conjunto de áreas clave para los próximos cinco años en los cuales la administración adoptará el papel de motor de la industria española de PNL. Se desarrollarán Proyectos Faro en tres áreas con gran impacto social en la economía española como son la salud, el turismo y la educación. Además, se espera que este plan quinquenal genere empleo de calidad y proporcione oportunidades económicas para las TIC españolas.

Esta nueva estrategia pretende impulsar una industria en la que España ha destacado en la última década, con contando con grandes investigadores, empresas y startups involucradas en PNL en proyectos en todo el mundo y en diversas industrias. España posee también una enorme experiencia en el manejo de entornos multilingües ya que cuenta con 4 lenguas cooficiales (español, catalán, gallego y vasco). “Debemos darnos prisa en la promoción de esta industria si queremos que nuestro país sea  líder en escenarios donde el español se está convirtiendo en una lengua internacional”.

La industria del turismo será un piloto para tecnologías de Procesamiento de Lenguaje Natural. Varias razones han llevado a la adopción de este plan. La Vicepresidenta destacó el alto nivel de investigación de la industria de la lengua en España y el número de proyectos europeos y de investigación internacional en los que participan muchas universidades y empresas. Varias razones han llevado a la adopción de este plan. La Vicepresidenta destacó el alto nivel de investigación de la industria de la lengua en España y el número de proyectos europeos y de investigación internacional en los que participan muchas universidades y empresas. La Sra. Saez de Santamaría también contrastó esto con la gran cantidad de información no estructurada que generan no sólo las administraciones locales y regionales, sino también los gobiernos internacionales, empresas y organizaciones. “Las experiencias en España y el buen gobierno, gracias al trabajo de instituciones como la Real Academia de la Lengua o en el Instituto Cervantes, entre otros, son tremendamente apreciados en el ámbito internacional”, destacó.

Telefónica participa en la investigación PLN: El valor médico del análisis del habla

Telefónica participa en la investigación PLN: El valor médico del análisis del habla

Los cuatro ejes del plan

El término procesamiento de Lenguaje Natural define el camino a una comprensión automática y cada vez más profunda de la lengua según la hablan o escriben las personas, usando tecnología digital. El lenguaje natural, contrariamente a lo que sucede con los datos que normalmente procesan los ordenadores, se caracteriza por poseer información no estructurada, la cual puede presentarse de modo ambiguo.

El Plan consta de un total de 29 medidas, las cuales se llevarán a cabo durante el periodo 2016-2020. Un comité de expertos de universidades e investigadores, representantes de la industria, sectores institucionales y académicos y la administración pública han participado en la redacción del plan.
El Plan consta de un total de 29 medidas, las cuales se llevarán a cabo durante el periodo 2016-2020. Un comité de expertos de universidades e investigadores, representantes de la industria, sectores institucionales y académicos y la administración pública han participado en la redacción del plan.

La nueva estrategia tiene cuatro líneas principales de acción: 1) apoyo a desarrollos de infraestructura lingüística, 2) impulso a la industria de la lengua, 3) la administración como motor del uso e implementación de las tecnologías del sector de lenguaje y 4) proyectos faros.

El plan, por ejemplo, generará herramientas de soporte multilenguaje en el sector de la salud para residentes extranjeros en España y españoles residentes en el extranjero. También hará uso de registros clínicos y medicamentos para ayudar en la toma de decisiones médicas.
Se desarrollarán aplicaciones de minería de opinión para la industria del turismo, de análisis de redes sociales y destinos turísticos, así como herramientas para la traducción automatizada de guías y portales web.

En la educación, la enseñanza en línea recibirá un gran impulso, con herramientas que simplifican los textos para educación especial, ayudando a profesores y a analizar opiniones. Además, habrá apoyo para la creación de cursos en línea y para la traducción automática en las lenguas cooficiales y variantes del español latinoamericano.

“Se dice que cada palabra que no conocemos es una idea que no podemos expresar,”, dijo Sáenz de Santamaría al principio de su discurso, haciendo hincapié en la importancia del Plan porque “gracias a esta tecnología podremos lograr que las computadoras entiendan nuestra lengua y nuestros textos”.
La Vicepresidenta afirmó otra vez que el plan pretende “situarnos en la vanguardia del desarrollo tecnológico”.

El evento ha recibido una amplia cobertura en la prensa nacional, con artículos en periódicos financieros como Expansión, revistas de informática como Computer World, y SiliconNews, además de la prensa digital (ElConfidencial), entre otros.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *


+ seis = 15

Puedes usar las siguientes etiquetas y atributos HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>