Traduire automatiquement cette langue donne des cauchemars à l’entreprise américaine. Aux difficultés de la langue s’ajoute le sabotage des internautes.
De toute évidence, la langue arabe rencontre beaucoup de problèmes sur le site de traduction automatique de Google. Seuls quelques versets coraniques sont traduits à la lettre, puisque, considérés comme sacrés, ils ont été préenregistrés afin d’éviter toute erreur. Mais il est rare que Google nous gratifie d’une bonne traduction quand il s’agit de la langue arabe.
Il peut donner des résultats corrects – ou au moins passables – pour des mots isolés, mais dès qu’on a affaire à des phrases complètes, voire à tout un texte, il faut se rendre à l’évidence : c’est mauvais. Ce n’est certainement pas la faute de l’entreprise américaine, qui cherche, en fin de compte, à offrir un service satisfaisant afin de gagner de l’argent depuis le lancement de ce service.
Or l’arabe n’est pas seulement une langue difficile à cause de son vocabulaire pléthorique, il a en plus la particularité qu’il faut mentalement ajouter les voyelles courtes pour comprendre une phrase [sauf exception, l’arabe s’écrit en effet sans voyelles courtes]. A cela s’ajoutent deux autres facteurs. Le premier est le faible volume de textes arabes sur Internet, avec seulement 3 % du contenu total de la Toile au niveau mondial, toutes langues confondues.
Sabotages
De plus, il ne s’agit pas de textes dûment établis – études, rapports officiels, textes journalistiques – mais d’une foule de textes disparates, écrits en divers dialectes sur d’innombrables forums et blogs bourrés de fautes, de tournures bancales et de barbarismes. Ce qui ne facilite pas la tâche des linguistes, qui ne peuvent pas s’en servir pour améliorer les performances de la traduction électronique comme ils le font pour les autres langues. Le seconde facteur se situe au niveau des utilisateurs. En effet, Google permet aux utilisateurs de noter les traductions, de signaler des contresens ou de proposer des améliorations.
Or rares sont ceux qui le font. Pire, beaucoup “sabotent” en s’amusant à suggérer des traductions fantaisistes. D’autres participent intensément, mais dans le but de mettre en avant leur propre dialecte, avec des expressions qui peuvent être incompréhensibles pour les autres, fussent-ils arabophones. Google ne fait en effet aucune distinction entre un internaute libanais et un internaute saoudien, puisqu’il n’offre pas de services distincts pour l’arabe littéral et les différents dialectes.
Champ de bataille
Il y a trois ans, le service de Google s’était transformé en champ de bataille entre internautes israéliens et arabes, les uns et les autres se dénigrant mutuellement. On suppose que ce sont des internautes israéliens qui ont essayé, fin 2010, de faire en sorte que la phrase “Israel will die” [Israël mourra] devienne en arabe “Israël ne mourra pas”. De même, la phrase arabe “L’islam n’est pas une religion terroriste” a donné le contraire en anglais : “Islam is the religion of terror” [l’islam est la religion de la terreur].
En face, les internautes arabes se sont mobilisés pour rétablir la bonne traduction pour ce genre de phrases, tout en multipliant les occurrences de formules telles que “le judaïsme est une religion terroriste” ou “Israël en enfer”. Depuis, Google a corrigé ces aberrations, sans parti pris politique ni religieux. Il n’empêche qu’un nombre non négligeable d’internautes arabes considèrent l’entreprise Google comme pro-israélienne, puisque ses fondateurs américains sont juifs. Ils ont donc développé des théories du complot à ce sujet et créé des pages Facebook pour appeler au boycott, pages qui, au demeurant, n’ont pas trouvé leur public.