Google Traduction a annoncé la semaine dernière la prise en charge de cinq nouvelles langues.
L’ajout du ouïghour, du tatar, du turkmène, du kinyarwanda et de l’odia porte l’offre totale du service basé sur l’intelligence artificielle (IA) à 108 langues.
La difficulté à recueillir une quantité suffisante de textes en lignes pour former des modèles d’apprentissage automatique empêchait autrefois la prise en charge de ces idiomes, parlés par environ 75 millions de personnes dans le monde.
Google avait aussi du mal à trouver des représentants humains de ces communautés linguistiques pour l’aider à affiner les modèles.
Le géant du Web affirme toutefois avoir grandement progressé sur les deux fronts au cours des dernières années.
« Nous avons pu ajouter ces langues grâce à l’amélioration de notre technologie d’IA et à la participation active des membres de la communauté Google Traduction », a indiqué un porte-parole de l’entreprise par communiqué.
La mise à jour est en cours de déploiement pour l’ensemble des utilisateurs de Google Traduction sur Android et iOS.
Le service propose la traduction de texte et de sites Web pour les cinq langues, mais offre l’option de saisie au clavier virtuel uniquement pour le kinyarwanda, le tatar et l’ughour.
Comme le rappelle The Verge, la prise en charge du ouïghour, parlée par 12 millions d’individus qui vivent principalement dans la région du Xinjiang, en Chine, revêt une importance géopolitique particulière.
Depuis 2017, le gouvernement chinois mène une campagne de répression et de détention de masse contre ce groupe ethnique à majorité musulmane.
Amnistie internationale estime qu’au moins un million de Ouïghours et de représentants d’autres communautés musulmanes sont actuellement séquestrés dans des « centres de rééducation », où ils subissent de nombreuses violations des droits de la personne.