Hablemos de lenguas, tecnología y traducción

Entradas clasificadas como ‘tradumática’

Espirales científicas y traducción automática

Viernes, 15 Febrero 2008 · Dejar un comentario

Ayer asistí a un agotador seminario (MATMT2008 workshop) que me ha dejado un sabor agridulce. El dulzor vino causado por dos motivos principales:

  1. El reencuentro con muchos viejos colegas (David Farwell, Victoria Arranz, Arantza Casillas, Germán Rigau, Lluís Màrquez, Patricia Fernández, Juan Hierro, la comunidad IXA en pleno, etc.).
  2. La satisfación de que se abordara la traducción automática desde una perspectiva por la que vengo abogando desde 1993 (cf el proyecto Legebiduna, presentado a Gobierno Vasco en 1994, ya contemplaba la aplicación de técnicas estadísticas a un corpus bilingüe de boletines oficiales).

Spiral

La amargura estuvo causada por el efecto de espiral científica que se apoderó del seminario y que acabó haciendolo soporífero. Estas espirales científicas son fenómenos de ensimismamiento, prepotente por lo general, que algunos investigadores son incapaces de detectar ni resolver (vg. Marcello Federico) y que enojan profundamente cuando se producen en situaciones en las que la audiencia es amplia, rica y heterogénea, como la de ayer.

SumatorioDurante demasiado rato hubo un exceso de vuelta de rosca a la estadística, técnica que ha dado casi todo de sí, y cuyos pormenores sólo interesan a los muy especialistas. Hubo ayer realmente muy poco de reflexión sobre lo que el sugerente título del seminario prometía ofrecer: La aplicación de distintas tecnología a problemas concretos, en contextos de traducción reales (como el que plantea el Gobierno Vasco en su concurso, muy bien asesorado por traductores humanos por cierto, que lamentablemente brillaron ayer por su ausencia). Andy Way compensó un poco la situación, pero su intervención llegó demasiado tarde, cuando el sesgo estadístico ya había echado a perder la jornada.

Así que quedaron en el tintero cuestiones como:

  • Aportación de las memorias de traducción (que es de facto la tecnología preferida por los traductores)
  • Flujo de trabajo en entornos de publicación multilingüe
  • Traducción vs localización
  • Técnicas de recolección de corpus multilingües
  • Tipologías textuales, lenguajes especiales
  • Criterios de calidad, protocolos, perfile, roles
  • Mantenimiento y alimentación automática de recursos tradumáticos
  • Sistemas de revisión y validación de recursos (corpus, terminología)
  • Potenciación de estándares para compartir recursos
  • Aprendizaje automático aplicado a los sistemas basados en reglas
  • Reutilización de módulos (diccionarios bilingües, reglas de transferencia)

Y otras muchas que ni pasaron por la mente de los ensimismados organizadores. Por cierto, ¿cómo traduciría yo Mixing approaches to Machine Translation? ¿mezclando aproximaciones…? No, tal vez mejor “Enfoques (o métodos) combinados en traducción automática”.

Categorías: euskara · tradumática
Etiquetado:

BasqueLem: Emergiatech enpresaren euskerarako lematizatzailea

Jueves, 12 Julio 2007 · Dejar un comentario

Emergiatech (Emerging Advanced Technologies, S.L.) enpresak, Eusko Jaurlaritzaren Kultura Sailak euskera bultzatzeko eskaintzen dauazan laguntzetariko bat lortu dau. Enpresa honek, euskararako lematizatzaile bat egiteko proiektua aurkeztu eban 2007ko IKT deialdira, eta hauxek lortu dau diru-laguntza. BasqueLem euskeraren azterketarako tresna eraberritzailea izango da, eta urteamaierarako amaitua egongo da.

www.emergiatech.com

Categorías: euskara · tradumática

¿Qué software me servirá mejor para montar un servicio multilingüe?

Jueves, 12 Octubre 2006 · Dejar un comentario

Se trata de una red de consultorías financieras que se va a extender por todo el mundo y que en el futuro pretende dar servicio en diversas lenguas, desde el inglés al tagalo. Será atendido por corresponsales que trabajarán en los países de destino, pero la base de operaciones estará en Madrid. Nuestra intención es montar un base documental con las preguntas más frecuentes, que nuestros corresponsales puedan consultar y mantener. ¿Qué posibilidades ofrece la traducción automática para que este servicio se pueda dar en cualquier idioma?

No existe ningún sistema de traducción automática que trabaje sin restricciones y ofrezca resultados de calidad.

Tampoco existe un sistema que traduzca del español a cualquier lengua del mundo.

Algunos sistemas, como Systran, dan una cobertura amplia y hacia muchos idiomas, pero la calidad nos es muy alta, aunque puede ser optimizado a base de introducir giros y frases hechas en el diccionario. También cuenta con memoria de traducción, que es una tecnología muy útil para reutilizar traducciones, evitando la repetición de esfuerzos.

El diseño de la base documental debe anticipar la cabida de textos en cualquier lengua del mundo, luego las nociones básicas de localización deberían ser tenidas en cuenta (Unicode, etc.)

Una alternativa a la traducción automática es la traducción asistida: buenos gestores de terminología y de memorias de traducción.

Productos que pueden considerarse:

  • Systran, http://www.systransoft.com. Sistema de traducción automática que más pares de lenguas aborda entre todos los sistemas del mercado. Los resultados deben ser revisados manualmente antes de ser publicados. El sistema admite ampliar los diccionarios bilingües para adecuarlos a los textos que se vayan a traducir, con lo que se pueden mejorar las traducciones. También posee una herramienta de gestión de memorias de traducción. El sistema puede ser probado en Internet.
  • MultiCorpora, http://www.multicorpora.ca. Potente sistema para gestionar traducciones remotamente, via web (mediante la herramienta MultiCorpora Shared Hosting Service).
  • Idiom, http://www.idiominc.com. Empresa que ofrece el sistema WorldServer, diseñado para facilitar la internacionalición de los procesos de publicación y gestión documental de las empresas. Muy utilizado por empresas que generan grandes volúmenes de documentación digitalizada, o de servicios web, con implantación mundial (Adobe, Baxter, eBay, etc.). Merece ser tenida en cuenta como modelo de internacionalización de servicios.
  • DVX, http://www.atril.com. Buena tecnología española, con oficina en Las Rozas. Conviene tratar con ellos para poder disponer de asistencia técnica y ayuda cerca de casa.
  • AutomaticTrans, http://www.automatictrans.es. Firma barcelonesa que comercializa el sistema ATS, capaz de generar volúmenes elevados de traducciones (catalán, portugués) y en contextos especializados (inglés). Disponen también de tecnología de gestión de contenidos.
  • Thera, http://www.thera-clic.com. Spin-off de la Universidad de Barcelona con excelente tecnología para el español. Desarrolla soluciones a medida del cliente, con experiencia en proyectos de multilingüismo.

Categorías: cat · mt · multilingual · tradumática · translation