Artículo 2/4 de la serie «Cuando las cifras se convierten en letras«
Hola a todos, queridos lectores.
Amicie de nuevo aquí con el segundo artículo de la serie «Cuando las cifras se convierten en letras» dedicada a la traducción automática.
En el primer artículo, vimos cómo fue la evolución de los traductores automáticos desde la Guerra Fría hasta la actualidad. Hoy vamos a analizar el aspecto más científico, más técnico, de estas tecnologías. Estoy hablando concretamente de la Inteligencia Artificial aplicada a la traducción automática, entenderemos mejor sus capacidades y sus límites.
Como lo sabemos, las Inteligencias Artificiales se multiplican constantemente y se extienden por todo el mundo. Se utilizan en muchos sectores, como la salud, el medio ambiente, el deporte, el derecho, etc. Pero hoy en este artículo hablaremos, específicamente de la Inteligencia Artificial1 al servicio de la traducción.
Cuando me interesé por primera vez en la inteligencia artificial, me sorprendieron las desigualdades que existen entre ellas. ¿Por qué algunas consiguen superar a los humanos en el ajedrez, mientras que otras consiguen, como mucho, darnos traducciones correctas, pero aún lejos del nivel de un buen traductor humano?
Esta observación me llevó a ponerme en contacto con un estudiante investigador de la ENS (Escuela Normal Superior de París), Emile Trotignon, especializado en informática, para que me explicara de forma sencilla cómo funciona la inteligencia artificial y cuál es la causa de estas desigualdades.
Estas fueron sus respuestas a las preguntas que le hice:
¿Cómo funciona la Inteligencia Artificiales?
Lo que hay que entender es que la Inteligencia Artificial, y en particular el Deep Learning, está hecho de redes neuronales profundas. Se basan en el funcionamiento de las neuronas del cerebro humano.
«La idea de una red neuronal es que una red neuronal es una función […] con varios parámetros« y «hay que darle datos para que aprenda«.
Para explicar cómo funcionan las redes neuronales, Emile utiliza el ejemplo del reconocimiento facial a través la figura de Michael Jackson.
«Por ejemplo, si quieres hacer una IA que reconozca a Michael Jackson, necesitas muchas fotos de Michael Jackson y de otras personas y necesitas saber de antemano cuáles son de Michael Jackson y cuáles no. Así que la función toma una imagen en blanco y negro y devuelve un número. La idea es que el número está necesariamente entre 0 y 1. Si es 1, la red piensa que es Michael Jackson en la foto, si es 0, piensa que no lo es y si es 0,5 no está seguro. Al principio, se designa por sorteo muchos ajustes. Así que la función (la red) dice cualquier cosa».
Hasta aquí, tiene bastante sentido y, por tanto, para el caso de los traductores automáticos, basta con sustituir las fotos de Michael Jackson por frases cuya traducción ya se conoce. Pero ¿cómo se enseña a la Inteligencia Artificial a distinguir entre lo que es verdadero y lo que es falso?
«Le damos una foto de Michael Jackson, vemos el resultado y cambiamos ligeramente los ajustes para acercarnos al resultado correcto. Podríamos cambiar todos los ajustes para que sea exactamente la respuesta correcta en esta foto, pero no es una buena idea porque si hacemos eso, vamos a crear una IA que sólo reconozca esta foto de Michael Jackson y no las demás. Así que hay que ir poco a poco y con muchas imágenes diferentes para que la red aprenda de verdad. Una vez que creemos que ha aprendido lo suficiente, lo ejecutamos con imágenes que no formaban parte de las imágenes de entrenamiento para comprobar que realmente ha aprendido a reconocer a Michael Jackson, y que no se ha limitado a aprender las imágenes de entrenamiento de memoria. Si ha aprendido de memoria, hay que cambiar el diseño, por ejemplo, reducir el número de ajustes o añadir más imágenes de entrenamiento.”
Y por eso, cuando escribes «Michael Jackson» en Internet, llegas directamente a una foto suya y no a una de Donald Trump, a pesar de su innegable parecido.
En el caso de la traducción automática, es el mismo principio que con Michael Jackson: las redes neuronales se entrenarán con frases y, para cada frase dada, la red neuronal comparará su propia traducción con la traducción real y corregirá sus errores modificando ligeramente los ajustes.
Los límites de la Inteligencia Artificial
Ahora que entendemos cómo funciona la Inteligencia Artificial, el problema persiste, ¿por qué algunas IIAA pueden ganar a los humanos en el ajedrez o en el Go, pero no pueden igualar a los humanos en la traducción?
«La razón por la que podemos hacer esto para el ajedrez y el Go es que el ajedrez y el Go son juegos muy deterministas […] En términos matemáticos, incluso decimos que son juegos de información completa, lo que significa que no hay nada que no puedas saber sobre el estado del juego […] así que hay un algoritmo para jugar al ajedrez perfectamente.”
En resumen, el algoritmo analizará todas las posibles jugadas del adversario y para cada movimiento determinará la mejor respuesta a dar. Los seres humanos no tienen la capacidad de hacerlo, porque supondría analizar 361 movimientos posibles sólo en el caso del Go.
No hay que olvidar que un ordenador trabaja con una secuencia de cifras. Así, para un ordenador entender los números es mucho más fácil que entender las letras. Las matemáticas son una ciencia exacta y el ordenador fue creado para dar resultados exactos. El ordenador es por definición muy «ordenado»: no hay nada más ordenado que un ordenador; una lengua, en cambio, es bastante desordenada: sus reglas cambian constantemente, evolucionan, y está llena de ambigüedades y aproximaciones.
De hecho, el lenguaje es un mecanismo extremadamente complejo. Incluso en nuestra propia lengua materna cometemos errores. No conocemos todas las reglas gramaticales o todas las palabras. Entre la jerga, los neologismos y los barbarismos, es casi imposible conocer una lengua a la perfección. El lenguaje humano sigue siendo aproximado.
Emile nos cuenta una anécdota sobre su abuelo que ilustra muy bien esta idea del ser humano aproximado.
«Mi abuelo contaba una anécdota sobre los libros de química traducidos por traductores experimentados, pero que no sabían de química. Algunas reacciones se denominan red-ox, por reducción-oxidación. Bueno, a veces se traducía al francés como “réaction de boeuf rouge” (reacción del buey rojo).
Así que, hoy en día, las IIAA no son muy buenas en las figuras retóricas, y no tienen realmente una pluma poética. Sin embargo, sus aspectos ordenados y precisos pueden ayudarnos con las traducciones de palabras específicas como red-ox.
La combinación de IA y traductores humanos es quizás la mejor solución hoy en día. Basta con utilizar IA específica en función de los textos a traducir. Esto es más o menos lo que ocurre con el uso cada vez más extendido de las herramientas de traducción asistida por ordenador por parte de los traductores profesionales. Estas herramientas funcionan con un sistema de memoria de traducción. En la TAO (traducción asistida por ordenador), el traductor humano realiza la traducción, pero recibe la ayuda del ordenador a través de herramientas terminológicas y de revisión.
Sin embargo, los traductores automáticos están empezando a surgir poco a poco. Recientemente, se está empezando a utilizar una nueva y muy controvertida forma de traducir en algunos libros o en los subtítulos en español de la famosa serie El juego del calamar. Se llama posedición. Esta nueva práctica consiste en dar un texto a traducir al ordenador, que lo traduce íntegramente y el revisor va detrás para hacer algunos cambios para que la traducción final sea más fluida.
Pero ¿cuáles son las ventajas de este nuevo proceso? ¿Supone un peligro para el trabajo de los traductores?
Lo descubriremos la próxima semana en un nuevo artículo sobre posedición.
Gracias, querido lector, por su atención, y hasta la próxima semana para un nuevo artículo.
-Amicie.
Lee todos mis artículos sobre traducción aquí >>
1 Cuando hablo de inteligencia artificial, en realidad me estoy refiriendo al Deep Learning que es una rama de la inteligencia artificial, si quieres saber más sobre el tema te dejo el enlace de un artículo que explica un poco más las diferencias entre IIAA: https://flatironschool.com/blog/deep-learning-vs-machine-learning.
Referencias
- Argüeso Gonzalez Antonio. La enseñanza asistida por ordenador. In: Équivalences, 21e année-n°1-2, 1992. pp. 87-110.
- DEPARDIEU, Ghilain. L’intelligence artificielle de demain. Arte, 30 de abril de 2021. 53min
- Meseguer González, P. y Ramon López de Mántaras Badia. (2017). Inteligencia artificial. Editorial CSIC Consejo Superior de Investigaciones Científicas. https://elibro-net.ponton.uva.es/es/lc/uva/titulos/42319
- Ségalat Laurent. L’Intelligence Artificielle. In: Raison présente, n°76, 4e trimestre 1985. Esprit, es-tu là ? pp. 83-97.
2 comentarios en “¿Cómo funcionan realmente los traductores automáticos?”