Condividi tramite


Guida ai formati dei documenti e alle convenzioni di denominazione

I file usati per la traduzione personalizzata devono includere almeno quattro caratteri.

Questa tabella include tutti i formati di file supportati che è possibile usare per creare il proprio sistema di traduzione:

Formato Estensioni Descrizione
XLIFF .XLF, .XLIFF Formato di documento parallelo, esportazione di sistemi di memoria di traduzione. Le lingue usate vengono definite all'interno del file.
TMX .TMX Formato di documento parallelo, esportazione di sistemi di memoria di traduzione. Le lingue usate vengono definite all'interno del file.
ZIP .ZIP Un formato di file di archivio.
Locstudio .LCL Formato Microsoft per i documenti paralleli
Microsoft Word .DOCX Documento di Microsoft Word
Adobe Acrobat .PDF Documento portatile di Adobe Acrobat
HTML .HTML, .HTM Documento HTML (HyperText Markup Language)
File di testo .TXT File di testo con codifica UTF-16 o UTF-8. Il nome del file non deve contenere caratteri giapponesi.
File di testo allineato .ALIGN .ALIGN è un'estensione speciale che è possibile usare se si è certi che le frasi nella coppia di documenti siano perfettamente allineate. Se si fornisce un file .ALIGN, Traduttore personalizzato non allinea le frasi automaticamente.
File di Excel .XLSX File di Excel (2013 o versione successiva). La prima riga del foglio di calcolo deve essere il codice della lingua.

Formati di dizionario

Per i dizionari, Traduttore personalizzato supporta tutti i formati di file supportati per i set di training. Se si usa un dizionario di Excel, la prima riga del foglio di calcolo deve includere i codici della lingua.

Formati dei file ZIP

I documenti possono essere raggruppati in un unico file ZIP e caricati. Traduttore personalizzato supporta i formati di file .ZIP (ZIP, GZ e TGZ).

Ogni documento nel file zip con estensione TXT, HTML, HTM, PDF, DOCX, ALIGN deve seguire questa convenzione di denominazione:

{nome documento}_{codice lingua} dove {nome documento} è il nome del documento e {codice lingua} è l'ID lingua ISO (due caratteri), indicante che il documento contiene frasi in tale lingua. Deve essere presente un carattere di sottolineatura (_) prima del codice della lingua.

Ad esempio, per caricare due documenti paralleli all'interno di un file ZIP per un sistema di traduzione dall'inglese allo spagnolo, i file dovrebbero essere denominati data_en e data_es.

I file della memoria di traduzione (TMX, XLF, XLIFF, LCL, XLSX) non devono seguire la convenzione di denominazione della lingua specifica.

Passaggi successivi