Qu’est-ce que la traduction de documents ?

Document Translation est une fonctionnalité basée sur le cloud du service Azure Translator qui fait partie de la famille Azure Cognitive Service des API REST. L’API de traduction de documentation peut être utilisée pour traduire des documents multiples et complexes dans la totalité des langues et dialectes pris en charge tout en conservant la structure de documents et le format de données d’origine.

Cette documentation contient les types d’articles suivants :

  • Les Démarrages rapides sont des instructions de prise en main qui vous guident dans la formulation de vos requêtes au service.
  • Les Guides pratiques contiennent des instructions sur l’utilisation de la fonctionnalité de manière plus spécifique ou personnalisée.
  • Les référence fournissent les paramètres, les valeurs, les mots clés et la configuration de l’API REST.

Fonctionnalités clés de Document Translation

Fonctionnalité Description
Traduire des fichiers volumineux Traduisez des documents entiers de manière asynchrone.
Traduire de nombreux fichiers Traduisez plusieurs fichiers dans la totalité des langues et dialectes pris en charge tout en préservant la structure des documents et le format des données.
Conserver la présentation du fichier source Traduisez les fichiers tout en conservant la disposition et le format d’origine.
Personnaliser la traduction Traduisez des documents à l’aide de modèles de traduction généraux et personnalisés.
Appliquer des glossaires personnalisés Traduisez des documents à l’aide de glossaires personnalisés.
Détecter automatiquement la langue du document Laissez le service de traduction de documentation déterminer la langue du document.
Traduire des documents présentant un contenu multilingue Utilisez la fonctionnalité de détection automatique pour traduire dans votre langue cible des documents présentant un contenu multilingue.

Notes

Lors de la traduction de documents présentant un contenu multilingue, la fonctionnalité est conçue pour traduire des phrases complètes dans une seule langue. Si les phrases sont composées de plusieurs langues, le contenu peut ne pas être traduit entièrement dans la langue cible. Pour plus d’informations sur les exigences d’entrée, consultezLimites de contenu.

Options de développement de la traduction de documentation

Vous pouvez ajouter une traduction de documentation à vos applications à l’aide de l’API REST ou d’un kit de développement logiciel (SDK) de bibliothèque cliente :

  • L’API REST. est une interface indépendante du langage qui vous permet de créer des requêtes HTTP et des en-têtes d’autorisation pour traduire des documents.

  • Les Kits de développement logiciel (SDK) de la bibliothèque cliente sont des classes, des objets, des méthodes et du code spécifiques au langage que vous pouvez utiliser rapidement en ajoutant une référence dans votre projet. Actuellement, la traduction de documentation propose un support du langage de programmation pour C#/.NET et Python.

Bien démarrer

Dans notre guide pratique, vous apprendrez comment commencer à utiliser la traduction de documentation. Pour commencer, vous avez besoin d’un compte Azure actif. Si vous n’en avez pas, vous pouvez créer un compte gratuit.

Formats de document pris en charge

Les types de fichiers de document suivants sont pris en charge par Document Translation :

Type de fichier Extension de fichier Description
Adobe PDF pdf Format de fichier de document portable. La traduction de documentation utilise la technologie de reconnaissance optique de caractères (OCR) pour extraire et traduire le texte d’un document PDF scanné tout en conservant la disposition d’origine.
Valeurs séparées par des virgules csv Fichier de données brutes délimité par des virgules utilisé par les programmes de feuille de calcul.
HTML html, htm Hyper Text Markup Language.
Format du fichier d’échange de localisation xlf Un format de document parallèles, pour les systèmes d’exportation de mémoires de traductions. Les langues utilisées sont définies dans le fichier.
Markdown markdown, mdown, mkdn, md, mkd, mdwn, mdtxt, mdtext, rmd Langage de balisage léger permettant de créer du texte mis en forme.
MHTML mthml, mht Format d’archive de page web utilisé pour combiner du code HTML et ses ressources associées.
Microsoft Excel xls, xlsx Fichier de feuille de calcul pour l’analyse et la documentation des données.
Microsoft Outlook msg E-mail créé ou enregistré dans Microsoft Outlook.
Microsoft PowerPoint ppt, pptx Fichier de présentation utilisé pour afficher le contenu dans un format de diaporama.
Microsoft Word doc, docx Fichier de document texte.
Texte OpenDocument odt Fichier de document texte open source.
Présentation OpenDocument odp Fichier de présentation open source.
Feuille de calcul OpenDocument ods Fichier de feuille de calcul open source.
Format de texte enrichi rtf Document texte contenant une mise en forme.
Valeurs séparées par des tabulations/TAB tsv/tab Fichier de données brutes délimité par des tabulations utilisé par les programmes de feuille de calcul.
Texte txt Document texte non mis en forme.

Types de fichiers hérités

Les types de fichiers sources sont conservés lors de la traduction de documents avec les exceptions suivantes :

Extension des fichiers sources Extension des fichiers traduits
.doc, .odt, .rtf, .docx
.xls, .ods .xlsx
.ppt, .odp .pptx

Formats de glossaire pris en charge

Les types de fichiers suivants sont pris en charge par Document Translation :

Type de fichier Extension de fichier Description
Valeurs séparées par des virgules csv Fichier de données brutes délimité par des virgules utilisé par les programmes de feuille de calcul.
Format du fichier d’échange de localisation xlf , xliff Un format de document parallèle, exportation des systèmes de mémoire de traduction utilisés par les langages sont définis dans le fichier.
Valeurs séparées par des tabulations/TAB tsv, tab Fichier de données brutes délimité par des tabulations utilisé par les programmes de feuille de calcul.

Étapes suivantes