Libération et traduction automatique

Le journal français Libération publie un excellent article sur la traduction automatique ce samedi 10 février. Frédérique Roussel a interviewé Jean Véronis (dont on connaît l’excellent blog sur les technologies de la langue), mais aussi Laurence Danlos (de Paris 7) et Christian Boitet, du GETA de Grenoble. On y parle aussi du Service de Traduction de la Commission Européenne, gros utilisateur de la traduction automatique, que je connais bien pour y avoir travaillé il y a quelques années.

La journaliste m’avait contacté pour en savoir plus sur les activités de Microsoft en la matière. J’ai pu jouer le rôle d’intermédiaire entre elle et notre collègue Chris Wendt, du groupe « Machine Translation » de Microsoft Research (MSR) ici à Redmond. Voici le passage de l’article abordant ce thème passionnant :

Une nouvelle approche a émergé depuis les années 90 : la traduction statistique, en particulier chez IBM. Cette technique, qui utilise des calculs de probabilité d'usage de mots et de phrases et repère dans une base de données les traductions précédentes de groupes de mots, s'avère bien plus rapide. Microsoft procède ainsi, pour alimenter sa base de connaissances (2), de 200 000 articles qui contient le mode d'emploi du baladeur Zune ou de la Xbox. «La traduction automatique par des méthodes statistiques nécessite une puissance de calcul et des capacités de stockage élevées. Il était quasiment impossible il y a cinq ou dix ans de créer un tel système», explique Chris Wendt, de l'équipe Traduction automatique de Microsoft à Redmond.

Il y aurait évidemment beaucoup d’autres choses à dire sur ce sujet et sur les activités de Microsoft en la matière. L’article est très bien écrit et retrace bien l’histoire de la traduction automatique et les défis à relever, passionnants pour les linguistes et les informaticiens.

Thierry Fontenelle [MSFT]

Microsoft Natural Language Group