Facebook AI puede traducir directamente entre 100 idiomas


Por Chris Stokel-Walker

Imagen predeterminada del nuevo científico

Facebook genera 20 mil millones de traducciones al día

incamerastock / Alamy

Facebook ha desarrollado una inteligencia artificial capaz de traducir con precisión entre cualquier par de 100 idiomas sin depender primero de la traducción al inglés, como hacen muchos sistemas existentes.

La IA supera a estos sistemas en 10 puntos en una escala de 100 puntos utilizada por los académicos para calificar automáticamente la calidad de las traducciones automáticas. Las traducciones producidas por el modelo también fueron evaluadas por humanos, que lograron una precisión de alrededor del 90%.

El sistema de Facebook se entrenó en un conjunto de datos de 7.500 millones de pares de frases recopilados de la web en 100 idiomas, aunque no todos los idiomas tienen el mismo número de pares de frases. "Lo que realmente me interesó fue dejar el inglés como intermedio. En todo el mundo hay muchas regiones en las que hablan dos idiomas que no son el inglés ”, dice Angela Fan de Facebook AI, quien dirigió el trabajo.

Publicidad

El modelo se formó centrándose en idiomas que comúnmente se traducen entre sí, agrupando los idiomas en 14 colecciones distintas según la geografía y las similitudes culturales. Esto se hizo para garantizar una traducción de alta calidad de las conexiones más utilizadas y para entrenar el modelo con mayor precisión.

Para algunos pares de idiomas, el nuevo sistema muestra mejoras significativas sobre la calidad de traducción existente. Por ejemplo, la traducción del español al portugués es particularmente interesante porque el español es el segundo idioma más hablado del mundo, lo que significa que los investigadores han tenido acceso a una gran cantidad de datos sobre la formación. La traducción entre inglés y bielorruso también ha mejorado con respecto a los esfuerzos existentes, ya que AI aprende traduciendo el ruso, que comparte similitudes con el bielorruso.

Aunque el sistema aún no está en uso en el sitio de redes sociales, Facebook planea implementarlo pronto para manejar los 20 mil millones de traducciones que se realizan todos los días cuando la gente hace clic en "Traducir" en artículos escritos en más de 160 Idiomas En el futuro, se trabajará en otros idiomas, dice Fan, "especialmente para los idiomas donde no tenemos muchos datos, como los idiomas del sudeste asiático y África".

El trabajo "rompe con modelos centrados en el inglés e intenta crear modelos multilingües más diversos", dice Sheila Castilho del centro ADAPT en Trinity College Dublin, Irlanda. "Es refrescante". Pero, dice Castilho, las evaluaciones humanas solo han analizado una pequeña fracción de ejemplos, lo que dificulta saber si se trata de un juicio acertado. sobre el rendimiento de la IA.

También le preocupa que la evaluación haya sido realizada por voluntarios bilingües en lugar de traductores profesionales. "Los no profesionales carecen de conocimientos de traducción y, por lo tanto, es posible que no noten las sutiles diferencias que hacen que una traducción sea mejor que otra", dice.

Su colega en el Centro ADAPT, Andy Way, sugiere que Facebook no está haciendo una comparación justa con los sistemas de traducción de vanguardia. “Su afirmación de una mejora tan grande con respecto a los modelos 'centrados en el inglés' no tiene sentido, porque la mayoría de las veces la gente ya no hace eso”, dice. Facebook no está de acuerdo y dice que la traducción al inglés sigue siendo común.

Referencia de la revista: Revista de investigación de aprendizaje automático, en la prensa

Obtenga más información sobre estos temas:

Sé el primero en comentar

Deja un comentario