Guida ai formati dei documenti e alle convenzioni di denominazione
I file usati per la traduzione personalizzata devono includere almeno quattro caratteri.
Questa tabella include tutti i formati di file supportati che è possibile usare per creare il proprio sistema di traduzione:
Formato | Estensioni | Descrizione |
---|---|---|
XLIFF |
.XLF , .XLIFF |
Formato di documento parallelo, esportazione di sistemi di memoria di traduzione. Le lingue usate vengono definite all'interno del file. |
TMX |
.TMX |
Formato di documento parallelo, esportazione di sistemi di memoria di traduzione. Le lingue usate vengono definite all'interno del file. |
ZIP |
.ZIP |
Un formato di file di archivio. |
Locstudio |
.LCL |
Formato Microsoft per i documenti paralleli |
Microsoft Word | .DOCX |
Documento di Microsoft Word |
Adobe Acrobat | .PDF |
Documento portatile di Adobe Acrobat |
HTML |
.HTML , .HTM |
Documento HTML (HyperText Markup Language) |
File di testo | .TXT |
File di testo con codifica UTF-16 o UTF-8. Il nome del file non deve contenere caratteri giapponesi. |
File di testo allineato | .ALIGN |
.ALIGN è un'estensione speciale che è possibile usare se si è certi che le frasi nella coppia di documenti siano perfettamente allineate. Se si fornisce un file .ALIGN , Traduttore personalizzato non allinea le frasi automaticamente. |
File di Excel | .XLSX |
File di Excel (2013 o versione successiva). La prima riga del foglio di calcolo deve essere il codice della lingua. |
Formati di dizionario
Per i dizionari, Traduttore personalizzato supporta tutti i formati di file supportati per i set di training. Se si usa un dizionario di Excel, la prima riga del foglio di calcolo deve includere i codici della lingua.
Formati dei file ZIP
I documenti possono essere raggruppati in un unico file ZIP e caricati. Traduttore personalizzato supporta i formati di file .ZIP (ZIP
, GZ
e TGZ
).
Ogni documento nel file zip con estensione TXT, HTML, HTM, PDF, DOCX, ALIGN deve seguire questa convenzione di denominazione:
{nome documento}_{codice lingua} dove {nome documento} è il nome del documento e {codice lingua} è l'ID lingua ISO (due caratteri), indicante che il documento contiene frasi in tale lingua. Deve essere presente un carattere di sottolineatura (_) prima del codice della lingua.
Ad esempio, per caricare due documenti paralleli all'interno di un file ZIP per un sistema di traduzione dall'inglese allo spagnolo, i file dovrebbero essere denominati data_en
e data_es
.
I file della memoria di traduzione (TMX
, XLF
, XLIFF
, LCL
, XLSX
) non devono seguire la convenzione di denominazione della lingua specifica.