Xuedong Huang en charge des recherches de Microsoft sur la parole, le langage naturel et la traduction automatique chez Microsoft. Photo: Scott Eklund/Red Box Pictures
Xuedong Huang en charge des recherches de Microsoft sur la parole, le langage naturel et la traduction automatique chez Microsoft. Photo: Scott Eklund/Red Box Pictures

Le traducteur chinois à anglais de Microsoft est aussi efficace qu’une personne pour traduire les nouvelles

Microsoft vient de franchir une étape importante avec le premier système de traduction automatique capable de traduire des articles de presse chinois en anglais, avec la même qualité et la même précision qu’une personne.

Les chercheurs de Microsoft Research ont utilisé comme documents les articles de newstest2017, un ensemble de données définit par un groupe d’universitaires et de partenaires de l’industrie, lors de la conférence WMT de 2017, pour un total d’environ 2 000 phrases.

Pour s’assurer que les résultats étaient justes et du niveau de ce qu’un être humain aurait obtenu, l’entreprise a fait appel à des traducteurs bilingues, afin de comparer les résultats du système à ceux de deux traductions indépendantes produits par des personnes.

Les chercheurs se sont attaqués à la traduction automatique depuis des décennies. Longtemps, on a cru qu’il serait impossible d’obtenir la parité avec l’être humain.

C’est récemment, avec les progrès en intelligence artificielle et les réseaux neuronaux que des progrès substantiels ont été constatés. Ces derniers résultats donnent l’espoir de donner aux hommes un outil pour surmonter la barrière du langage.

Les chercheurs de Microsoft ont exploité l’apprentissage automatique (machine learning) en tirant parti de plusieurs techniques :

– double apprentissage : la traduction de chinois à anglais est immédiatement traduite en chinois, ce qui permet de vérifier la justesse des traductions ;

– Réseaux de délibération : similaire à la façon dont une personne revoit et édite ses traductions, encore et encore ;

– Apprentissage commun : le système anglais à chinois s’entraîne avec de nouvelles phrases. Ces nouvelles paires de phares sont alors exploitées pour l’entraînement du système chinois à anglais ;

– Régularisation de l’accord : quand le système produit la même traduction en traduisant de gauche à droite et de droite à gauche, elle est supposée plus précise que si les méthodes donnaient des résultats différents.

De nombreux défis doivent encore être surmontés. En premier lieu, vérifier que le système traduit aussi bien les vrais articles de presses que ceux du test.

 

Les professionnels et les curieux trouveront plus de précision dans l’article de recherche Achieving Human Parity on Automatic Chinese to English News Translation publié le 12 mars 2018.

Il est également possible de tester le système.

Microsoft s’est également distingué en janvier en obtenant pour la première fois la parité avec l’être humain sur des tests de compréhension.