¿Qué es la traducción automática?

La traducción automática (en adelante, TA) es un área de conocimiento cuyo objetivo es el desarrollo de sistemas informáticos para traducir texto o habla de un lenguaje natural a otro.

Aunque el ideal es realizar automáticamente traducciones de alta calidad, en la práctica la TA no está orientada a la traducción de todo tipo de textos, sino que se especializa en los textos de carácter técnico, como los científicos, comerciales, patentes, manuales de instrucciones, etc. En resumen, se trata de textos en los que lo que interesa es poder expresar el significado del texto en otro idioma lo más rápidamente posible, sin ninguna pretensión estética ni literaria. De hecho, normalmente el texto de salida de una traducción automática debe ser revisado, pues no está pensado como un medio de suplir a los traductores, sino de facilitarles la tarea.

Traducir automáticamente el lenguaje natural no es tarea sencilla, ya que no se trata de una simple sustitución de palabras. Los usos idiomáticos, la ambigüedad, palabras que no tienen equivalencia léxica en la lengua de llegada o las posibles diferencias entre las estructuras sintácticas de las lenguas son sólo algunos de los problemas con los que se encuentra esta disciplina. Por ello, es preciso que en este ámbito converjan, al menos, dos disciplinas: la informática, que proporciona las herramientas informáticas necesarias para desarrollar el software, y la lingüística, que contribuye con su conocimiento de las lenguas para realizar traducciones cada vez más precisas.

 

La TA es la consecuencia de la necesidad de los seres humanos de comunicarse independientemente de la lengua materna de cada individuo. Esta preocupación se puede rastrear desde el siglo XVII, cuando surgió la idea de la creación de una “lengua universal” no ambigua y basada en principios lógicos y símbolos icónicos, con la que se pudieran romper fácilmente las barreras del lenguaje. Tanto Descartes como Leibniz propusieron la creación de diccionarios basados en códigos numéricos universales y en ello trabajaron Cave Beck, Athanasius Kircher y Johann Becher y John Wilkins, que desarrolló una lengua de esta clase en en su obra de 1668 Essay towards a Real Character and a Philosophical Language. La preocupación por comunicarse de una manera global y prescindiendo de las dificultades de la ambigüedad dio como resultado el desarrollo de lenguas artificiales, como el Esperanto, creada por L. L. Zamenhof en 1876.

Pero no fue hasta el siglo XX cuando el problema de la comunicación entre hablantes de distintas lenguas se intentó resolver no a través de otro lenguaje artificial, sino por medio de mecanismos que automatizaran el proceso de traducción entre las lenguas naturales. En 1933 aparecieron dos patentes de artilugios de ayuda a la traducción. El primero surgió en Francia, donde George Artsruni, de origen armenio, diseñó un artefacto al que llamó “Cerebro Mecánico” que podía reemplazar palabras o combinaciones de ellas gracias a un diccionario. Ese mismo año, P.P. Trojanskij, que trabajaba en la Unión Soviética, propuso un sistema de traducción en el que se introducían las palabras de la lengua de origen en un diccionario con unas “marcas lógicas” y se emparejaban con las palabras de un diccionario de la lengua de destino que tuvieran las mismas marcas. Trojanskij nunca pudo ver cómo su idea se convertía en una realidad, pues la informática aún no era capaz de hacerlo. Y es que el progreso de la TA inevitablemente va de la mano del desarrollo de la informática.

toyanskii
Esquema de la máquina diccionario de Trojanskij (1933)

El paso definitivo en la TA tuvo lugar durante la Guerra Fría, a partir de las conversaciones que tuvieron el científico británico Andrew D. Booth y el estdounidense Warren Weaver, en aquel momento vicepresidente de la Fundación Rockefeller. La coyuntura política internacional hizo que se generara mucho interés en torno a las maneras de traducir con rapidez y precisión textos en ruso al inglés. Se le atribuye a Weaver la idea de que esto se podía hacer mediante la computación, de un modo similar al que en la II Guerra Mundial se había utilizado para descodificar mensajes enemigos. A pesar de haber conseguido suficiente financiación, Weaver no pudo conseguir los resultados esperados, quizá porque, de nuevo, la informática no se había desarrollado lo suficiente (se programaba mediante el cableado de tableros en lenguaje máquina) como para obtener resultados satisfactorios.

En 1952, el MIT organizó un congreso al que se invitó a todos los investigadores de la materia. Como resultado, en 1954, la Universidad de Georgetown en colaboración con IBM realizó un experimento (el Experimento de Georgetown) en el que gracias a un programa con seis reglas gramaticales y 250 ítems léxicos se tradujeron automáticamente más de 60 frases escritas en ruso romanizado al inglés. El éxito del experimento contribuyó al optimismo general respecto al desarrollo de la TA y, por tanto, al aumento de financiación para la investigación.

El experimento de Georgetown no fue el único: Se efectuó una demostración en 1954 con el equipo APEXC en la Birkbeck Collage (Universidad de Londres) de una traducción rudimentaria del inglés al francés. También se publicaron varios trabajos de investigación sobre el tema, e incluso artículos en revistas populares.

Sin embargo, la investigación en la TA se encontró con muchos escollos debidos, sobre todo, a la ambigüedad y a la polisemia del lenguaje natural, lo que hizo que el progreso fuera mucho más lento de lo que se había estimado en un principio. En 1966 el Gobierno de EEUU formó un comité para la evaluación de la investigación, el ALPAC (Automated Language Processing Advisory Commitee), que emitió un informe muy desfavorable: concluyeron que la Traducción Automática era más lenta, menos precisa y dos veces más cara que la traducción por humanos, lo que provocó una disminución drástica del interés con la consiguiente reducción de financiación.

El desarrollo de la Traducción Automática, como ya se ha mencionado, estaba muy condicionado por las limitaciones técnicas de la informática. Por eso, cuando se aumentó la potencia de cálculo de los ordenadores, aumentó de nuevo el interés en la TA, sobre todo en la basada en modelos estadísticos. La investigación sobre TA en la Universidad de Georgetown dio como resultado el desarrollo del sistema SYSTRAN, creado por Peter Toma en 1970 y utilizado aún hoy día. La Comisión Europea adquirió una versión inglés-francés y otra italiano-inglés de este sistema. A partir de entonces empezaron a desarrollarse núcleos de investigación fuera de Estados Unidos (proyecto EUROTRA). También, a finales de los 70, la Organización Pan-Americana de Salud comenzó un proyecto de traducción automática español-inglés (SPANAM) y la Fuerza Aérea Estadounidense formó el sistema METAL y en la Universidad de Texas, el grupo de investigación TAUM comenzó a trabajar en el sistema METEO. La investigación en el campo de la TA que se hizo en décadas posteriores surgió de estas iniciativas y de sus resultados.

Sin título
“Traducción automática y la montaña rusa de la historia”. Viñeta en Arnold et al. (1994:15)

En la actualidad, se desarrolla investigación en la TA en numerosas universidades y empresas como IBM, Microsoft, Google, Fujitsu, Xerox. En España, destaca el trabajo que se lleva a cabo en la versión española del proyecto europeo EUROTRA en la Universidad de Barcelona, en el proyecto METAL por parte de la Universidad Autónoma de Barcelona junto con Siemens o en la Universidad de Alicante, donde han desarrollado el sistema Apertium en colaboración con otras empresas y universidades españolas, que sirve para traducir entre las lenguas españolas y otras lenguas románicas.

 

Referencias bibliográficas

Arnold, D. – Balkan, L. – Meijer, S. – Humphreys R. L. – Sadler, L. (1994), Machine Translation: An Introductory Guide, Blackwell.

Horwood, E. (1986), Machine Translation: past, present, future, consultado en http://www.hutchinsweb.me.uk/PPF-TOC.htm (30/12/2015).

Hutchins, W.J. – Somers, H. (1992), An introduction to machine translation, consultado en http://www.hutchinsweb.me.uk/IntroMT-TOC.htm (30/12/2015).

Somers, H. (2003), Computers and Translation: A translator’s guide, John Benjamins.

Anuncios

¡Deja un comentario!

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

w

Conectando a %s