Partager via


Note de transparence d’Azure AI Translator

Important

Les traductions non anglaises sont fournies uniquement pour des raisons pratiques. Veuillez consulter la version EN-US de ce document pour la version faisant foi.

Un système d’intelligence artificielle (IA) inclut non seulement la technologie, mais aussi les personnes qui l’utiliseront, les personnes qui seront affectées par elle et l’environnement dans lequel il est déployé. La création d’un système en alignement avec l’objectif visé exige de bien comprendre comment la technologie fonctionne, de connaître ses capacités et ses limites, et de savoir comment atteindre le meilleur niveau de performance. Les notes de transparence Microsoft sont destinées à vous aider à comprendre le fonctionnement de notre technologie IA, les choix que les propriétaires du système peuvent faire qui influencent les performances et le comportement du système, ainsi que l’importance de réfléchir à l’ensemble du système, y compris la technologie, les personnes et l’environnement. Vous pouvez utiliser des notes de transparence lors du développement ou du déploiement de votre propre système ou les partager avec les personnes qui utiliseront ou seront affectées par votre système.

Les notes de transparence Microsoft font partie d’un effort plus large de Microsoft pour mettre en pratique nos principes d’IA. Pour en savoir plus, consultez les principes de l’IA Microsoft.

Principes de base d’Azure AI Translator

Présentation

Azure AI Translator est un service IA qui traduit du texte d’un langage naturel à un autre. Dans la littérature machine learning, ce processus est appelé traduction automatique. L’application de techniques d’IA a rendu la traduction automatique entre les langues beaucoup mieux au cours des 70 dernières années de recherche en traduction automatique, au point que nous pouvons présenter le résultat de la traduction automatique vers des destinataires humains pour la consommation directe, sans modification, dans certains cas d’usage.

Translator fournit une API qui vous permet de traduire d’une langue à une autre ou de plusieurs langues à la fois.

En interne, chaque traduction linguistique est effectuée en tant qu’acte distinct. Vous pouvez traduire entre plus de 135 langues et dialectes offerts par Translator.

Les systèmes de traduction d’entraînement dépendent de la disponibilité des données entre les paires linguistiques. Nous créons des systèmes bilingues (systèmes de traduction entre deux langues) ou des systèmes multilingues (systèmes de traduction entre plusieurs langues). En fonction de la qualité du modèle, le service choisit le chemin optimal d’une traduction particulière demandée par l’utilisateur.

La traduction entre certaines paires peut impliquer un passage par une troisième langue. Par exemple, la traduction entre Swahili et Hindi peut impliquer la traduction de Swahili vers l’anglais suivie d’une traduction de l’anglais vers l’hindi. Ce processus est effectué automatiquement dans le service.

Termes clés

Terme Définition
Caractère L’API Translator compte chaque point de code défini dans Unicode en tant que caractère.
Expression de texte Phrase complète ou partielle.
Document Collection de texte dans un format de fichier numérique, y compris, mais pas limité au document Word, à la feuille de calcul Excel, à la présentation PowerPoint, Adobe PDF, HTML, Text et Markdown.
Style et registre La manière d’orthographe/ponctuation du texte, qui peut affecter la qualité de la traduction.

Capacités

Comportement du système

Azure AI Translator dispose de fonctionnalités pour :

  • Traduire du texte en plusieurs langues.
  • Convertir du texte d’un script à un autre.
  • Traduisez de manière asynchrone des lots de documents volumineux en plusieurs langues qui conservent la structure et la disposition comme dans le document source.
  • Traduisez de façon synchrone un petit document unique en une langue cible qui conserve la structure et la disposition comme dans le document source.

Cas d’utilisation

Utilisations prévues

Les classes suivantes de cas d’usage de traduction sont fournies pour vous aider à réfléchir à vos propres scénarios :

Traduction sortante : un éditeur d’informations fournit des documents ou du texte dans plusieurs langues, ciblant l’audience cible dans la langue du destinataire. Il existe différentes classes et formats de matériel sortant, par exemple des flyers marketing, des vidéos d’information ou des manuels d’usine. La traduction automatique est plus adaptée à certaines classes que pour d’autres. En règle générale, la pertinence de la traduction automatique est inversement proportionnelle à la créativité du contenu. La traduction peut être publiée sous forme de contenu web, d’un document électronique ou sous-titres vidéo ou de doublage ou imprimée sur papier.

  • Traduction brute : publiez la traduction telle qu’elle est fournie par le système de traduction automatique. Ce cas d’usage porte le coût le plus bas et présente un taux d’erreur non négligeable. Il devrait y avoir des mécanismes en place pour réagir aux mauvaises traductions, comme les commentaires des consommateurs.
  • Traduction post-modifiée : publiez la traduction post-modifiée, qui est le résultat de la traduction automatique corrigée par un réviseur humain. L’intervention humaine augmente le coût par rapport à la traduction brute par un facteur de plus de 1 000, mais elle réduit considérablement le taux d’erreur et améliore la fluidité et la compréhension de la traduction.

Traduction entrante : une personne reçoit des informations dans une langue étrangère et utilise Translator pour traduire les informations dans leur langue maternelle. Il s’agit par exemple de sites web, de révisions de produits, de rapports financiers et commerciaux ou de rapports de bogues arrivant dans une langue étrangère. La tolérance aux erreurs de traduction peut être plus élevée dans ce cas d’usage, mais la traduction peut entraîner des malentendus significatifs dans un nombre non négligeable de cas. Souvent dans ce scénario, une traduction automatique est meilleure qu’aucune traduction. Un individu ou une entreprise peut filtrer ou classifier automatiquement pour extraire des informations, ou appliquer d’autres techniques d’IA sur des documents provenant de diverses sources, y compris des documents en langue étrangère. Par exemple, il peut s’agir de la surveillance multimédia, des assistants virtuels multilingues ou de la découverte électronique. Le destinataire applique la traduction automatique avant de transmettre le document à l’analyse automatique. La plupart du temps, ce processus est entièrement automatisé sans intervention humaine.

Traduction bidirectionnelle : deux personnes ou plus qui ne parlent pas la même langue utilisent la traduction automatique dans une conversation en direct sur la messagerie instantanée ou dans une conversation parlée. Par exemple, un agent de support ne parle pas la même langue que le client qui recherche de l’aide.

Séquencement de plusieurs services IA :

  • Traduction vocale : Azure Speech, un autre des services Azure AI, peut traduire la voix entre les langues. Speech génère la transcription dans la même langue que la parole d’origine, puis utilise Translator pour traduire la transcription en interne. Les cas d’usage incluent la conversation vocale humaine à humaine traduite, le doublage ou le sous-titre du contenu.
  • Traduction de texte dans des images : Azure Computer Vision, un autre service Azure AI, peut extraire du texte visible à partir d’images. Ce texte extrait peut ensuite être traduit. Les cas d’usage incluent la traduction de documents numérisés, de menus et de signes.

Points à prendre en considération lors du choix d’autres cas d’utilisation

La qualité de la traduction sera influencée par la pertinence du contenu traduit. Le style et le registre du texte en cours de traduction et le cas d’usage déterminent l’adéquation :

Envisagez d’utiliser : contenu correctement orthographié et ponctué et précis et fluent. Voici quelques exemples de ce contenu :

  • Documentation technique
  • Manuels de produit
  • Bases de connaissances
  • Contenu du site web

Réfléchissez soigneusement à l'utilisation de : traduction de documents non professionnels. Voici quelques exemples :

  • Écriture familière
  • Discours transcrit
  • Conversation sur les réseaux sociaux

Envisagez soigneusement d’appliquer une révision humaine lorsque des données sensibles ou des scénarios sont impliqués : il est important d’inclure un humain dans la boucle d’une révision manuelle lorsque vous traitez de scénarios à enjeux élevés (par exemple, affectant les droits consécutifs d’une personne) ou des données sensibles. La traduction automatique peut faire des erreurs. Tenez compte soigneusement quand inclure une étape de révision manuelle pour certains flux de travail. Par exemple, la traduction des dossiers médicaux doit inclure la surveillance humaine.

Examinez attentivement l’utilisation pour attribuer ou refuser des avantages : Translator n’a pas été conçu ou évalué pour l’octroi ou le refus des avantages, et l’utilisation dans ces scénarios peut avoir des conséquences inattendues. Ces scénarios sont les suivants :

  • Assurance médicale : il s’agirait notamment d’utiliser des dossiers médicaux traduits et des ordonnances médicales comme base de décisions sur la récompense ou le déni d’assurance.
  • Approbations de prêts : il s’agit notamment de traduire les demandes de nouveaux prêts ou de refinancement des prêts existants.

Utilisations non prises en charge :

  • Documents juridiques : Les contrats mal traduits entraînent un non-respect des contrats.
  • Contenu créatif, tel que des supports marketing, de la poésie et de la fiction : la traduction ne transmet pas la créativité.

Considérations juridiques et réglementaires : les organisations doivent évaluer des obligations légales et réglementaires spécifiques potentielles lors de l’utilisation de services et de solutions IA, ce qui peut ne pas convenir à une utilisation dans chaque secteur ou scénario. En outre, les services ou solutions IA ne sont pas conçus dans ce but et ne doivent pas être utilisés avec des moyens interdits par les conditions d’utilisation du service et les codes de conduite appropriés.

Limites

La traduction automatique peut être une méthode économique pour fournir des traductions de grands volumes de contenu dans un temps beaucoup plus court. La traduction automatique coûte moins de 1/1 000e de traduction humaine et est plus rapide, mais elle peut faire des erreurs.

Les modèles de traduction automatique personnalisés produisent généralement une sortie nettement meilleure avec un petit nombre d’erreurs de terminologie. Ces modèles de traduction automatique sont formés avec des traductions précédentes à la fois suffisamment nombreuses et de bonne qualité, adaptées au client.

Limitations techniques, facteurs opérationnels et plages

Contexte complet du document

Les systèmes de traduction de documents complets sont en cours de développement, mais la plupart des systèmes de traduction automatique généralement disponibles aujourd’hui, y compris le nôtre, traitent une phrase de document par phrase. Lorsque les systèmes d’aujourd’hui traduisent une phrase, la plupart d’entre eux n’ont aucune connaissance des phrases précédentes ou ultérieures dans le même document. Les informations nécessaires pour traduire correctement une phrase (par exemple, pronoun genre et nombre) peuvent uniquement être disponibles au niveau du document, ce qui entraîne une mauvaise traduction.

Exemple :

  1. Anglais : Le soleil était sur le point de se coucher. Ça brillait encore intensément.
  2. Traduction automatique en allemand : Die Sonne stand kurz vor dem Untergehen. Es leuchtete noch hell.

Le « soleil » en allemand a le sexe féminin. La traduction automatique dans cet exemple a utilisé le sexe neutre.

Dans les traductions d’un original sans genre à une traduction gendered, le système de traduction suppose un sexe. Il tente de produire une phrase couramment correcte et grammaticalement correcte dans la langue cible. Lorsque le système utilise un genre, il applique un biais au sexe qui était répandu pour le contexte donné dans le matériel utilisé pour former le système. Cette pratique peut entraîner des erreurs.

Les constructions sans genre se produisent dans une grande variété de langues, notamment le chinois, le finnois, le tamoul, le turc et le vietnamien.

Séquencement de plusieurs services IA

Lors du séquencement de plusieurs services qui ont chacun un taux d’erreur différent de zéro, les erreurs s'accumulent. La traduction de résultats de reconnaissance vocale ou de reconnaissance optique de caractères (OCR) ne pourra pas se récupérer d’une erreur à l’étape de reconnaissance et ajoutera ses propres erreurs après la reconnaissance.

Entrées en plusieurs langues

Chaque demande de traduction se traduit d’une langue à une autre langue. Si plusieurs langues se trouvent dans le texte source d’une demande de traduction unique, la traduction du texte dans la langue cible peut être non optimale. Il peut être laissé comme tel, être mal traduit, être traduit correctement, ou il peut être translittéré correctement ou incorrectement.

Translator peut détecter automatiquement la langue du texte source, mais elle applique la langue détectée à l’intégralité du texte.

Connaissances réelles

Un système de traduction automatique est formé sur des documents traduits précédemment. Le système utilise uniquement ce qui peut être appris à partir des phrases individuelles des documents de formation ; il n’a pas de contexte plus large.

Ce manque de connaissances réelles peut provoquer plusieurs erreurs, telles que :

  • Les traductions sont trop littérales, ne reflétant pas l’implication, la nuance ou l’inuendo de l’original.
  • Les idiomes et les expressions qui ne sont pas conçues littéralement n’expriment pas la signification implicite de l’original. Voici un exemple en anglais : « Knocking it out of the ballpark ».
  • Lorsqu’une traduction nécessite une modification sensible à la culture de l’original, elle peut ne pas être reflétée de manière appropriée. Cette erreur peut se produire pour une conversion monétaire, une conversion de format de date ou d’heure, une modification du nom de la langue lorsque la langue officielle d’une région est destinée, ou modification de la région, pour une localisation appropriée du document cible.
  • Les titres et les rangs des individus ne sont potentiellement pas reflétés de manière appropriée, par exemple, lorsqu’ils sont traduits d’une langue étrangère à la culture de l’individu.
  • Le ton et l'ambiance (en colère, calme, excité, triste) de l'original pourraient ne pas être représentés de façon appropriée. En règle générale, la traduction automatique est plus neutre et moins colorée que l’original.
  • L’âge, le titre, la relation ou l’expérience d’une personne abordée dans une conversation peut ne pas être reflétée de manière appropriée. Cette erreur est particulièrement importante lors de la traduction d’une langue où la façon de traiter quelqu’un est relativement indépendante de l’âge et de la relation, comme « vous » en anglais, dans une langue où il existe plusieurs options, telles que « tu » et « vous » en français. Quelle forme d’adresse à utiliser est presque toujours pertinente. Le système de traduction choisit le terme qui correspond le mieux à ses données d’apprentissage, en fonction du contexte court qu’il voit dans la phrase, mais il ne sait pas, par exemple, si les participants à la conversation sont liés, même si ces informations sont mentionnées ailleurs dans le document.

Erreurs de gravité élevée

Les erreurs de gravité élevée sont définies comme des erreurs qui peuvent ternir la réputation de la personne ou de l’institution parlant dans une voix traduite, ou dans un texte traduit ou un document, qu’il s’agisse d’une traduction humaine ou automatique. Une erreur de gravité élevée est embarrassante pour l’orateur ou l’auteur, ou peut entraîner une conclusion incorrecte avec des conséquences significatives. Une mauvaise traduction ou une erreur de grammaire seule ne se qualifie pas comme une erreur de gravité élevée. La plupart des erreurs dans la traduction automatique peuvent être corrigées par le réviseur en fonction du contexte. Une erreur de gravité élevée entraîne un effet négatif tangible.

Exemples d’erreurs potentielles de gravité élevée :

  • Négation inversée : le texte d’origine dit ne pas faire quelque chose ; cependant, la traduction indique de le faire. Ou l’énoncé original énonce un fait, mais la traduction indique l’inverse. Les phrases complexes et les doubles négatifs peuvent provoquer cette erreur.
  • Nombre modifié ou unité de mesure : un indicateur de dimension, une unité de mesure ou une devise (pouce, livre, centimètre, centimes) est mal traduit, ce qui peut entraîner une mesure incorrecte ou une perte ou un gain excessif de fonds.
  • Noms et titres de personne falsifiés : le titre incorrect est appliqué à une personne, par exemple « Roi », où il doit s’agir de « Prince de la Couronne ». Dans un environnement politiquement sensible, cette erreur peut entraîner une gêne significative.
  • Figures religieuses ou symboles placés dans un contexte défavorable : l’ambiguïté dans le matériau original peut conduire à une traduction qui montre une figure religieuse significative ou un symbole pertinent dans une lumière défavorable. Il peut être aussi simple qu’une expression avec une connotation religieuse apparaissant comme la traduction, ou un non-mot tel qu’une abréviation, une faute de frappe ou une entrée sans signification.
  • Omissions et contenu non fondé : La traduction automatique peut omettre une partie du contenu source ou ajouter un concept qui n’était pas présent dans l’original. Les réseaux neuronaux sont capables de produire des phrases très fluides. Une phrase source inhabituelle ou disfluente peut être traduite en une phrase cible Fluent qui ne reflète pas l’origine exactement ou peut être complètement non liée à la source.
  • Offense : Une traduction littérale d’un idiome ou d’une expression neutre pourrait se transformer plus agressive ou offensive. Certaines expressions n’ont pas d’équivalent culturel dans la langue cible. Par exemple, « Break a leg » est une expression pour souhaiter bonne chance avant de monter sur scène. Le système n’est peut-être pas conscient du contexte complet pour obtenir une traduction adaptée.

Avec les systèmes de traduction automatique d’aujourd’hui, les erreurs de gravité élevée sont rares. La peur d’une erreur préjudiciable à la réputation est un obstacle majeur à la publication de traduction automatique brute et non modifiée. Bien que le risque d’erreurs de gravité élevée puisse être faible pour des paires de langages plus compatibles, un développeur souhaite utiliser des techniques pour réduire l’effet si l’un d’eux doit se produire. Actuellement, les traducteurs humains sont mieux équipés pour rechercher et corriger des erreurs de gravité élevée que les machines. L’ajout d’une étape de révision humaine pour rechercher et corriger des erreurs de gravité élevée dans la traduction automatique est un moyen de résoudre cette limitation. Vous pouvez également envisager d’ajouter une révision humaine à la demande ou en fonction de métriques décisionnels, telles que les évaluations utilisateur, l’audience ou l’importance du contenu, après avoir publié le document non examiné.

Biais

Les systèmes de traduction automatique d’aujourd’hui reposent sur des algorithmes de Machine Learning. Les systèmes de traduction apprennent à traduire à partir de documents traduits précédemment. Ce que le système a appris est stocké dans un modèle probabiliste, qui est généralement un réseau neuronal. Le runtime qui gère une demande de traduction fait référence à ce réseau neuronal pour produire ce qu’il détermine est le meilleur candidat parmi les traductions possibles pour l’entrée donnée. Cette traduction reflète le domaine, la terminologie, le style et le biais présents dans le matériel d’apprentissage original. Ce biais peut être très subtil. Dans certaines paires de langues, par exemple, lors de la traduction d’une phrase sans pronoun de sujet, le système constitue un pronoun, car la grammaire de la langue cible requiert un sujet. Le sexe de ce pronoun composé sera influencé par le contexte trouvé dans le matériel de formation, quel que soit le sexe réel du sujet dans le document en cours de traduction. Cette question est un domaine de recherche active, et nous travaillons à résoudre les problèmes liés aux préjugés.

Exemples de biais potentiels dans la traduction automatique :

  • Biais de genre : lors de la traduction d’une langue neutre par sexe vers une langue fortement genderée, les pronous choisis seront influencés par le contexte trouvé dans le matériel de formation, ce qui pourrait ne pas refléter le sexe réel de l’acteur.
  • Biais politique : les expressions ou les choix de mots avec un biais politique dans une langue ne traduisent pas nécessairement avec le même biais ou la même connotation dans l’autre langue.
  • Préjugé religieux : comme le biais politique, le choix des mots peut indiquer un point de vue spécifique, une certaine croyance ou une dogme. Lorsque vous changez de langage, ce point de vue peut être ajouté ou supprimé ou modifié à une interprétation différente.
  • Orientation sexuelle, origine nationale, origine ethnique, race : les termes que la société s’applique aux groupes au sein de cette société changent au fil du temps. Un terme discriminatoire écrit dans un document original pourrait avoir persisté dans le matériel d’apprentissage et pourrait apparaître dans la traduction dans un contexte préjudiciable.
  • Profanité : Ce qui est considéré comme profane au sein d’une culture change au fil du temps. L’intention du système de traduction est de maintenir la nature profane ou nonprofane de l’expression dans l’entrée. Ce niveau de précision ne fonctionne pas avec 100% fiabilité, car de nombreux termes profanes sont en fait ambigus, et le degré de profanité du terme traduit varie entre les langues impliquées.

Performances du système

  • L’API Translator n’a aucune limite sur les requêtes simultanées.
  • L’API Translator définit différents quotas sur le nombre de caractères qui peuvent être traduits en une heure par une ressource de traducteur basée sur la référence SKU concédée sous licence par le client. Les limites de quota varient de 40 millions de caractères par heure à 200 millions de caractères par heure.
  • Translator a une latence maximale de 15 secondes à l’aide de modèles standard. En général, les réponses pour un texte de moins de 100 caractères sont retournées dans un délai de 150 à 300 millisecondes.
  • Les temps de réponse de l’API Translator varient en fonction de la taille de la demande et de la paire de langues.
    • La traduction entre une langue et l’anglais est plus rapide que la traduction entre deux langues non anglaises.

Bonnes pratiques pour améliorer les performances du système

  • Les utilisateurs peuvent obtenir de meilleures performances sur la traduction d’une expression de texte en plusieurs langues cibles en effectuant des requêtes individuelles pour chaque langue plutôt que d’effectuer une seule requête pour plusieurs langues. Cette approche permet aux utilisateurs de consommer des traductions disponibles au lieu d’attendre que toutes les traductions soient retournées par le système.
  • Si votre volume de traduction est élevé, basculez vers des niveaux d’engagement ou de volume plus élevés.

Évaluation d’Azure AI Translator

Méthodes d’évaluation

La qualité de la traduction est toujours relative à un jeu de tests. Il n’existe aucun ensemble de tests de traduction standard établi pour l’évaluation. Pour cette raison, nous ne publions pas les scores absolus de nos propres mesures des systèmes de traduction automatique.

Les systèmes de traduction automatique basés sur le réseau neuronal d’aujourd’hui peuvent produire des phrases fluent et grammaticalement correctes, en fonction d’une source appropriée. Toutefois, la qualité des systèmes de traduction automatique diffère selon la paire de langues. Nous pouvons déterminer si une certaine classe de documents convient à la traduction automatique pour une paire de langues spécifique.

Nous vous recommandons de mesurer la qualité d’un jeu de tests représentatif pour un scénario donné. Le niveau de tolérance de la mauvaise traduction par langue varie selon le scénario. L’attente de traduction linguistique, formelle et familière varie également selon le scénario.

Résultats d’évaluation

Il existe de nombreuses façons de mesurer la qualité. Les techniques automatiques calculent la distance à une traduction de référence créée par l’homme. Le score BLEU (Bi-lingual Evaluation Understudy) est la technique la plus ancienne et elle est toujours répandue. D’autres techniques utilisent un modèle de langage entraîné pour mesurer la distance entre les séquences et le contexte stockés dans le modèle, comme la métrique optimisée croisée pour l’évaluation de la traduction (COMET). Dans une évaluation humaine, les évaluateurs jugent la traduction sur un ou plusieurs critères, par exemple, la précision et la fluidité. Nous mesurons en permanence la qualité de Translator à l’aide d’une multitude de techniques. L’évaluation humaine fournit les scores les plus significatifs et les plus fiables.

Évaluation et intégration d’Azure AI Translator pour votre utilisation

Comme Microsoft travaille pour aider les clients à développer et déployer des solutions en toute sécurité à l’aide de Translator, nous adoptons une approche fondée sur des principes visant à maintenir l'autonomie personnelle et la dignité en tenant compte de l’équité, de la fiabilité et de la sécurité, de la confidentialité, de l’inclusion, de la transparence et de la responsabilité humaine. Ces considérations sont conformes à notre engagement à développer une IA responsable.

Lorsque vous êtes prêt à intégrer et utiliser des produits ou fonctionnalités optimisés par l’IA, gardez à l’esprit les principes suivants :

  • Recommandations de prédéveloppement des applications : nous recommandons aux développeurs de commencer par effectuer une évaluation de l’impact pour comprendre l’utilisation, le contexte et les utilisations involontaires ou à haut risque pour éviter.
  • Comprendre ce qu’il peut faire : évaluez entièrement Translator pour comprendre ses fonctionnalités et/ou ses limitations. Les tests de Microsoft peuvent ne pas refléter votre scénario. Découvrez comment il s’effectuera dans votre scénario particulier en le testant soigneusement avec des conditions réelles et diverses données utilisateur qui reflètent votre contexte, y compris les considérations d’équité.

Humain dans la boucle : incluez la surveillance humaine comme un domaine de modèle cohérent à explorer. Cette approche consiste à assurer une surveillance humaine constante de Translator et à maintenir le rôle des humains dans la prise de décision. Assurez-vous que vous pouvez avoir une intervention humaine en temps réel dans la solution pour prévenir les dommages. Cette fonctionnalité vous permet de gérer les situations où Translator ne fonctionne pas comme prévu.

  • Mesures de qualité : nous vous recommandons de mesurer la qualité de traduction pour un jeu de tests représentatif pour un scénario donné. Le niveau de tolérance de la mauvaise traduction par langue varie selon le scénario. L’attente de traduction linguistique, formelle et familière varie également selon le scénario. Pour plus d’informations, consultez la section suivante.
  • Respectez le droit d’une personne à la confidentialité : Translator ne conserve pas le contenu que les clients soumettent pour traduction. Nous vous recommandons de conserver le contenu et les informations reçues des utilisateurs de votre application pour respecter le droit des personnes à la confidentialité.
  • Révision légale : obtenez des conseils juridiques appropriés pour examiner votre solution, en particulier si vous envisagez de l’utiliser dans des applications sensibles ou à haut risque. Comprenez les restrictions que vous devrez peut-être utiliser et votre responsabilité pour résoudre les éventuels problèmes futurs.
  • Sécurité : assurez-vous que votre solution est sécurisée et dispose de contrôles adéquats pour préserver l’intégrité de votre contenu et empêcher l’accès non autorisé.
  • Boucle de commentaires des clients : fournissez un canal de commentaires qui permet aux utilisateurs et aux individus de signaler des problèmes avec le service une fois qu’il a été déployé. Une fois que vous avez déployé Translator, il nécessite une surveillance et une amélioration continues. Soyez prêt à implémenter tout retour et toute suggestion à des fins d’amélioration.

Intervention humaine

Une introduction responsable de la traduction automatique inclut la possibilité d’effectuer une révision humaine et de corriger la traduction automatique.

Les réviseurs humains ont des connaissances réelles, une expertise en matière et une sensibilité naturelle pour les mots et expressions potentiellement controversés. Les humains peuvent identifier le contexte pertinent et produire une traduction qui reflète le ton approprié pour une situation donnée. Les machines sont plus limitées dans leur capacité à appliquer correctement le ton et le contexte.

Il est utile de préparer l’infrastructure qui peut exécuter une révision humaine rapidement et efficacement. Ce type de système est appelé système de gestion des traductions (TMS). Les TMS sont disponibles auprès de nombreux fournisseurs. Microsoft ne vend pas de TMS. Translator est intégré à plusieurs TMS.

L’examen humain est une entreprise coûteuse. Pour une utilisation optimale des fonds et une disponibilité immédiate des documents à un public cible, vous devez identifier les indicateurs en fonction de l’utilisation prévue ou de l'intelligence économique. Ces indicateurs peuvent suggérer que l’article ou l’élément d’un document a besoin d’une révision humaine.

Exemples de signaux d'intelligence économique :

  • Affichages de page : l’éditeur d’informations traduites décide d’un seuil mesuré dans les vues de page des informations traduites. Si les informations traduites par l’ordinateur passent le seuil défini d’affichage de page, le système déclenche une révision humaine de ce contenu. L’examen humain peut réduire l’exposition d’une mauvaise traduction à d’autres visiteurs ou clients.
  • Escalade de l’utilisateur : le destinataire de la traduction peut fournir des commentaires ou émettre une alerte sur une traduction incorrecte, trompeuse ou offensive. Cette escalade déclenche une révision humaine du contenu en question.
  • Escalade des employés : un employé de l’éditeur d’informations traduites peut émettre une demande d’examen humain d’un article.
  • Importance ou valeur de l’article : un article sur ou une description d’un article à bas prix et à faible volume à vendre peut ne pas être économiquement réalisable pour être traduit par un humain. Toutefois, un élément à valeur plus élevée peut bien justifier les dépenses d’une traduction humaine. La valeur élevée peut déclencher automatiquement une révision humaine de la traduction.
  • Adéquation : Certaines classes de documents se traduisent avec une meilleure qualité que d’autres. Un éditeur peut utiliser des mécanismes de scoring automatiques ou une classification du contenu du document pour déterminer si ce document a besoin d’une révision humaine. Microsoft Azure propose certaines techniques de classification basée sur le contenu, telles que Language Understanding et Analyse de texte. Translator ne retourne pas de score de confiance pour ses traductions.

Étapes suivantes