Formatos de documentos e diretrizes de convenção de nomenclatura

Qualquer arquivo usado para tradução personalizada deve ter pelo menos quatro caracteres de comprimento.

Essa tabela inclui todos os formatos de arquivos com suporte que podem ser utilizados para construir o sistema de tradução:

Formatar Extensões Descrição
XLIFF .XLF, .XLIFF Um formato de documento paralelo, exportação de sistemas de Memória de Tradução. Os idiomas utilizados são definidos dentro do arquivo.
TMX .TMX Um formato de documento paralelo, exportação de sistemas de Memória de Tradução. Os idiomas utilizados são definidos dentro do arquivo.
ZIP .ZIP ZIP é um formato de arquivo.
Locstudio .LCL Um formato da Microsoft para documentos paralelos
Microsoft Word .DOCX Documento do Microsoft Word
Adobe Acrobat .PDF Documento portátil do Adobe Acrobat
HTML .HTML, .HTM Documento HTML
Arquivo de texto .TXT Arquivos de texto codificados em UTF-16 ou UTF-8. O nome do arquivo não deve conter caracteres em japonês.
Arquivo de texto alinhado .ALIGN A extensão .ALIGN é uma extensão especial que você poderá usar se souber que as sentenças no par de documentos estão perfeitamente alinhadas. Se você fornecer um arquivo .ALIGN, o Tradutor Personalizado não alinhará as sentenças para você.
Arquivo do Excel .XLSX Arquivo Excel (2013 ou posterior). A primeira linha/linha da planilha deverá ser o código do idioma.

Formatos de dicionário

Para dicionários, o Tradutor Personalizado é compatível com todos os formatos de arquivos com suporte para conjunto de treinamento. Se estiver usando o dicionário do Excel, a primeira linha/coluna da planilha deverá ter os códigos de idiomas.

Formatos de arquivo zip

Os documentos podem ser agrupados em um único arquivo zip e enviados. O Tradutor Personalizado dá suporte a formatos de arquivos zip (ZIP, GZ e TGZ).

Cada documento no arquivo zip com extensão TXT, HTML, HTM, PDF, DOCX, ALIGN deve seguir essa convenção de nomenclatura:

{nome do documento}_{código do idioma} onde {nome do documento} é o nome do documento, {código do idioma} é a ID de idioma ISO (dois caracteres), indicando que o documento contém sentenças nesse idioma. É necessário ter um sublinhado (_) antes do código do idioma.

Por exemplo, para carregar dois documentos paralelos em um zip para um sistema de inglês para espanhol, os arquivos deverão ser nomeados como "data_en" e "data_es".

Arquivos de memória de tradução (TMX, XLF, XLIFF, LCL, XLSX) não precisam seguir a convenção de nomenclatura de idioma específico.

Próximas etapas