Guide sur les formats de documents et les conventions d’affectation de noms
N’importe quel fichier utilisé pour un modèle de traduction personnalisée doit être d’au moins quatre caractères.
Cette table comprend tous les formats de fichier pris en charge que vous pouvez utiliser pour générer votre système de traduction :
Format | Extensions | Description |
---|---|---|
XLIFF | .XLF, .XLIFF | Un format de document parallèles, pour les systèmes d’exportation de mémoires de traductions. Les langues utilisées sont définies dans le fichier. |
TMX | .TMX | Un format de document parallèles, pour les systèmes d’exportation de mémoires de traductions. Les langues utilisées sont définies dans le fichier. |
ZIP | .ZIP | ZIP est un format de fichier d’archive. |
LocStudio | .LCL | Un format de Microsoft pour les documents parallèles |
Microsoft Word | .DOCX | Document Microsoft Word |
Adobe Acrobat | Document de la version portable d’Adobe Acrobat | |
HTML | .HTML, .HTM | Document HTML |
Fichier texte | .TXT | Fichiers texte encodés en UTF-16 ou UTF-8. Le nom de fichier ne doit pas contenir de caractères japonais. |
Fichier d’alignement de textes | .ALIGN | L’extension .ALIGN est une extension spéciale que vous pouvez utiliser si vous savez que des phrases de votre paire de documents se correspondent parfaitement. Si vous fournissez un fichier .ALIGN , Custom Translator n’aligne pas les phrases pour vous. |
Fichier Excel | .XLSX | Fichier Excel (2013 ou version ultérieure). La première ligne de la feuille de calcul doit être le code de langue. |
Formats de dictionnaires
Pour les dictionnaires, Custom Translator prend en charge tous les formats de fichier pris en charge pour les jeux d’entraînement. Si vous utilisez un dictionnaire Excel, la première ligne de la feuille de calcul doit correspondre aux codes de langue.
Formats de fichiers compressés
Les documents peuvent être regroupées dans un seul fichier compressé et téléchargés. Custom Translator prend en charge les formats de fichiers compressés .ZIP, .GZ et .TGZ.
Chaque document du fichier zip avec l’extension TXT, HTML, HTM, PDF, DOCX, ALIGN doit suivre cette convention de nommage :
{nom du document}_{code de langue} où {nom du document} correspond au nom de votre document, {code de langue} correspond au LanguageID ISO (deux caractères), indiquant que le document contient des phrases dans cette langue. Il doit y avoir le code de langue doit être précédé d’un trait de soulignement (_).
Par exemple, afin de charger deux documents parallèles dans un fichier zip pour un système traduisant de l’anglais vers l’espagnol, les fichiers doivent être nommés « data_en » et « data_es ».
Cette convention de nommage utilisée pour indiquer une langue spécifique ne s’applique pas aux fichiers de mémoire de traduction (TMX, XLF, XLIFF, LCL, XLSX).
Étapes suivantes
Commentaires
https://aka.ms/ContentUserFeedback.
Bientôt disponible : Tout au long de l’année 2024, nous abandonnerons progressivement le mécanisme de retour d’information GitHub Issues pour le remplacer par un nouveau système de commentaires. Pour plus d’informations, consultez :Soumettre et afficher des commentaires pour