¿A quién no le gusta un maratón de Netflix? ¿Te gusta empezar tu día con una playlist de fondo? ¿O leer un libro de la saga del momento? Probablemente tienes acceso a consumir esos materiales en tu idioma, ¿no es así? Vamos, de los más de siete mil idiomas hablados en el mundo, por lo menos dominas uno o dos, pero ¿te has preguntado cómo es que una serie coreana llega a tu catálogo de Netflix y le entiendes al momento en que le das play? En este artículo vamos a explicarte un poco del código detrás de esas letritas que corren por tu pantalla mientras ves anime japonés.

Hoy en día es más fácil consumir medios audiovisuales: basta con unos clics para seleccionar un anime y los subtítulos de tu preferencia, sin necesidad de aprender otro idioma. Gracias al constante intercambio tecnológico a nivel global, tenemos la oportunidad de romper con barreras culturales, sociales y lingüísticas para así acercarnos a otros mundos —ficticios o no.


TA, nuestra Torre de Babel

Adivina, adivinador, ¿qué es esa herramienta que transforma tu inglés al español? Ya la conoces por una clase de inglés o por usarla en tu celular para descubrir qué decía esa canción de BTS. Bueno, no es ningún secreto que Google Traductor te sacó de un apuro o una carcajada en algún momento ¿y qué hay del secreto detrás de él? Te damos una pista: tiene  que ver con programación.

No podemos arrancar sin lo básico: en Lingüística, la traducción es un proceso que consiste en producir el texto de un idioma origen a otro texto en un idioma meta. Es decir, pasar de un idioma A al idioma B y hacer que el texto final se lea como si fuese el producto original. Y si nos ponemos más techies, este proceso también aplica para otras vertientes llamadas traducción automática y traducción asistida por computadora. Estas son utilizadas, ahora más que nunca, para ayudar a no perderte de los diálogos en tu videojuego foráneo.

El código detrás de las letritas 

Por un lado, la traducción automática que utiliza Google Traductor (TA o MT por machine translation en inglés) es un proceso automatizado que funciona con un software de computadora para traducir textos de un idioma a otro. La TA procesa y restaura el significado del texto origen en el de destino, no es palabra por palabra, sino que interpreta, analiza y compara todos los elementos. Además, requiere conocimientos lingüísticos especializados, córpora lingüísticos (bases de datos terminológicas), técnicas estadísticas y neurales para mejorar la calidad de las traducciones, pues la máquina tiene que aprender a hablar según los conjuntos de reglas entre los idiomas a transferir. Aquí tomemos como ejemplo a Google Translate, Deepl y PROMT.One.
Por el otro, la traducción asistida por computadora (TAC o CAT por computer-assisted translation en inglés) se diferencia un poco de la anterior porque requiere de la intervención humana en su desarrollo. Una herramienta TAC —Smartcat, Trados o memoQ— consiste en presentar el texto origen en la plataforma y poner otras aplicaciones informáticas a disposición del traductor —memorias de traducción, glosarios mono y bilingües, extensiones de TA, alineadores de textos, gestor de proyectos, etc.— con el propósito de brindar un espacio funcional para desempeñar la labor. En este caso, la TAC incluye un sistema con acceso a memorias de traducción que pueden ser reutilizadas gracias al índice de coincidencia sacado de traducciones hechas previamente por profesionistas. También dicho sistema permite almacenar, navegar, extraer y crear recursos lingüísticos que ayuden a mejorar la productividad del usuario.

Ambos recursos son de gran utilidad para las personas detrás del subtitulaje de tu serie favorita, pero aún así no son perfectos. La razón es que la máquina por sí sola aún no logra distinguir esos matices de significado cuando los humanos nos expresamos. Si has estado en nuestro blog por un rato, ya sabrás que hemos hablado de machine learning antes y la moraleja es que hay procesos donde las computadoras son nuestras amigas y nos necesitan para funcionar correctamente. Asimismo, nosotros recurrimos a ellas para ser más productivos con nuestras tareas del día a día. Sin duda, ¡las máquinas aún necesitan ayuda de un humano de confianza!


Un error o dos en la Matrix del GT

Okay, Google Traductor, traduce 7 Rings al japonés… ¡¿Qué, cómo que «barbacoa japonesa»?!
Bueno, un error lo comete cualquiera, hasta Google Translate y Ariana Grande con su tatuaje para 7 Rings. No es el único caso donde GT mete la pata, entonces, ¿dónde está la falla? ¿Es realmente culpa de la máquina? Como ya mencionamos arriba, las máquinas aún necesitan intervención humana para pulir los resultados que arroja. A continuación, hablemos de los posibles glitches de las herramientas de TA.

Algoritmo: El método de conversión de Google Translate es el principal responsable de errores, pues su algoritmo parte de datos donde traduce términos con su significado más común y por colocación. La cosa es que la estadística no logra dar con esos matices que distinguen a cada idioma. Por eso, es necesario ampliar la información ingresada al código para que la TA comience a aprender distinciones entre usted y, por decir algo. Si bien, buscamos que una TA nos ayude a automatizar la tarea de traducir, ¡no queremos que automatice el lenguaje!


Posedición: El juego del calamar llegó a Netflix hace tiempo y causó controversia: una, por su trama y dos, por su calidad de subtitulaje. El gremio de traductores alrededor del mundo denunció la mala praxis de algunas empresas que se valen de una TA para ahorrar tiempo y dinero en lugar de pagar por una traducción desde cero. El problema es que los productos como los videojuegos o series de TV parten de una mala base pues la tendencia es usar una TA sin posedición de un profesional y el resultado es incoherente para los usuarios. Incluso, hay empresas que combinan ambos métodos: la posedición para textos repetitivos y formulaicos como menús y mensajes de sistema y la traducción profesional para los textos más creativos, como diálogos, narración, etc.

Matices y otros chistes locales: Entre traductores suele decirse que «el contexto importa» y ese es el pequeño gran detalle que una TA aún no logra dominar, a pesar de que mejora poco a poco gracias a la IA. Una TA toma como referencia las bases de datos y elige las palabras por uso más común, sin embargo, algunas TA no logran distinguir categorías gramaticales como los sustantivos propios y hay veces que los traducen como si fueran comunes. En el caso de los refranes y chistes, las bases de datos no arrojan equivalencias, sino traducciones literales. Y cuando una palabra tiene varios significados también sueles obtener un resultado fuera de contexto.

Extensión: Intenta meter una letra completa de tu canción favorita y el resultado te sorprenderá. En cambio, si metes frases más cortas, lograrás leer traducciones más coherentes. Aquí parece que el algoritmo de la TA está diseñado para resolver eficazmente según la extensión. 

El inglés como referente: Aquí los programadores no contemplaron lo vasto que es el lenguaje y lo que pasa es que el GT no traduce directamente entre lengua A y B, sino que lengua A pasa por el inglés y luego al B. Esto no es más que una práctica para economizar, pues a la ‘gran G’ le es más práctico pasar 79 idiomas al inglés y de ahí al deseado por el usuario. ¿Cuál sería la solución más inclusiva? Los programadores tendrían que actualizar la base de datos constantemente para facilitar la recopilación de traducciones entre los distintos idiomas y dialectos de su sistema y no nada más textos que tienen como origen o destino el inglés.

Pídele a GT que te traduzca un chiste y dinos cómo le va. Si bien la tecnología está para mejorar nuestras vidas, aún no podemos prescindir del toque humano. Nuestro consejo es: ojo, pero mucho ojo al usar una TA, toma lo bueno que las herramientas informáticas ofrecen ¡y sé ese/a programador/a que las mejore! Si quieres iniciar el viaje de aprendizaje en la programación para romper barreras, unirte a una clase prueba en BYJU’S FutureSchool es tu puerta para explorar otros mundos.

Redacción: Evelyn Meza