O que é a Tradução de Documentos?

A Tradução de Documentos é um recurso de tradução automática baseado em nuvem do serviço Azure AI Translator . Você pode traduzir vários documentos complexos em todos os idiomas e dialetos suportados, preservando a estrutura original do documento e o formato de dados. A API de tradução de documentos suporta duas operações de tradução:

Tradução em lote assíncrona

Use o processamento assíncrono de documentos para traduzir vários documentos e arquivos grandes.

Principais recursos do lote

Funcionalidade Description
Traduzir arquivos grandes Traduza documentos inteiros de forma assíncrona.
Traduzir inúmeros arquivos Traduza vários arquivos em todos os idiomas e dialetos suportados, preservando a estrutura do documento e o formato de dados.
Preservar a apresentação do arquivo de origem Traduza arquivos preservando o layout e o formato originais.
Aplicar tradução personalizada Traduza documentos usando modelos de tradução gerais e personalizados.
Aplicar glossários personalizados Traduza documentos usando glossários personalizados.
Detetar automaticamente o idioma do documento Deixe que o serviço de Tradução de Documentos determine o idioma do documento.
Traduzir documentos com conteúdo em vários idiomas Use o recurso de deteção automática para traduzir documentos com conteúdo em vários idiomas para o idioma de destino.

Opções de desenvolvimento em lote

Você pode adicionar a Tradução de Documentos aos seus aplicativos usando a API REST ou um SDK de biblioteca cliente:

  • A API REST. é uma interface agnóstica de linguagem que permite criar solicitações HTTP e cabeçalhos de autorização para traduzir documentos.

  • Os SDKs de biblioteca de cliente são classes, objetos, métodos e código específicos do idioma que você pode usar rapidamente adicionando uma referência em seu projeto. Atualmente a Tradução de Documentos tem suporte à linguagem de programação para C#/.NET e Python.

Formatos de documentos suportados em lote

O método Get supported document formats devolve uma lista de formatos de documentos suportados pelo serviço de Tradução de Documentos. A lista inclui a extensão de arquivo comum e o tipo de conteúdo se estiver usando a API de carregamento.

Tipo de ficheiro Extensão de nome de ficheiro Description
Adobe PDF pdf Formato de arquivo de documento portátil. A tradução de documentos usa a tecnologia de reconhecimento ótico de caracteres (OCR) para extrair e traduzir texto em documento PDF digitalizado, mantendo o layout original.
Valores separados por vírgulas csv Um arquivo de dados brutos delimitado por vírgulas usado por programas de planilha.
HTML html, htm Linguagem de marcação de hipertexto.
Formato de arquivo de intercâmbio de localização XLF Um formato de documento paralelo, exportação de sistemas de memória de tradução. As línguas utilizadas são definidas dentro do ficheiro.
Markdown markdown, , , , , , , mdtext, mdtxtmkdnmdmdownmkdmdwnrmd Uma linguagem de marcação leve para criar texto formatado.
MHTML mthml, mht Um formato de arquivo de página da Web usado para combinar código HTML e seus recursos complementares.
Microsoft Excel xls, xlsx Um arquivo de planilha para análise de dados e documentação.
Microsoft Outlook msg Uma mensagem de email criada ou salva no Microsoft Outlook.
Microsoft PowerPoint ppt, pptx Um arquivo de apresentação usado para exibir conteúdo em um formato de apresentação de slides.
Microsoft Word doc, docx Um arquivo de documento de texto.
Texto OpenDocument odt Um ficheiro de documento de texto de código aberto.
Apresentação OpenDocument odp Um arquivo de apresentação de código aberto.
Folha de cálculo OpenDocument ods Um ficheiro de folha de cálculo de código aberto.
Formato Rich Text rtf Um documento de texto que contém formatação.
Valores separados por tabulação/TAB tsv/tab Um arquivo de dados brutos delimitado por tabulações usado por programas de planilha.
Texto txt Um documento de texto não formatado.

Tipos de arquivo herdados em lote

Os tipos de arquivo de origem são preservados durante a tradução do documento, com as seguintes exceções:

Extensão do arquivo de origem Extensão de arquivo traduzido
.doc, .odt, .rtf, .docx
.xls, .ods .xlsx
.ppt, .odp .pptx

Formatos de glossário suportados por lote

A Tradução de Documentos suporta os seguintes tipos de ficheiros de glossário:

Tipo de ficheiro Extensão de nome de ficheiro Description
Valores separados por vírgulas csv Um arquivo de dados brutos delimitado por vírgulas usado por programas de planilha.
Formato de arquivo de intercâmbio de localização xlf , xliff Um formato de documento paralelo, exportação de sistemas de memória de tradução As línguas utilizadas são definidas dentro do ficheiro.
Valores separados por tabulações/TAB tsv, tab Um arquivo de dados brutos delimitado por tabulações usado por programas de planilha.

Tradução síncrona

Use o processamento de tradução síncrona para enviar um documento como parte do corpo da solicitação HTTP e receber o documento traduzido na resposta HTTP.

Principais recursos de tradução síncrona

Funcionalidade Description
Traduzir arquivos de página única A solicitação síncrona aceita apenas um único documento como entrada.
Preservar a apresentação do arquivo de origem Traduza arquivos preservando o layout e o formato originais.
Aplicar tradução personalizada Traduza documentos usando modelos de tradução gerais e personalizados.
Aplicar glossários personalizados Traduza documentos usando glossários personalizados.
Tradução em língua única Traduza de e para um idioma suportado.
Detetar automaticamente o idioma do documento Deixe que o serviço de Tradução de Documentos determine o idioma do documento.
Aplicar glossários personalizados Traduzir um documento usando um glossário personalizado.

Formatos de documentos síncronos suportados

Tipo de ficheiro Extensão de nome de ficheiro Tipo do conteúdo Description
Texto simples .txt text/plain Um documento de texto não formatado.
Valores separados por tabulação .txv
.tab
text/tab-separated-values Um formato de arquivo de texto que usa guias para separar valores e novas linhas para separar registros.
Valores separados por vírgulas .csv text/csv Um formato de arquivo de texto que usa vírgulas como um delimitador entre valores.
Linguagem de marcação de hipertexto .html
.htm
text/html HTML é uma linguagem de marcação padrão usada para estruturar páginas da web e conteúdo.
MHTML .mthml
.mht
message/rfc822
@application/x-mimearchive
@multipart/related
Um formato de arquivo de página da Web.
Microsoft PowerPoint .pptx application/vnd.openxmlformats-officedocument.presentationml.presentation Um formato de arquivo baseado em XML usado para apresentações de slides do PowerPoint.
Microsoft Excel .xlsx application/vnd.openxmlformats-officedocument.spreadsheetml.sheet Um formato de arquivo baseado em XML usado para planilhas do Excel.
Microsoft Word .docx application/vnd.openxmlformats-officedocument.wordprocessingml.document Um formato de arquivo baseado em XML usado para documentos do Word.
Microsoft Outlook .msg application/vnd.ms-outlook Um formato de arquivo usado para objetos de mensagem de email do Outlook armazenados.
Intercâmbio de localização XML .xlf
.xliff
application/xliff+xml Um formato de arquivo padronizado baseado em XML amplamente utilizado no processamento de software de tradução e localização.

Formatos de glossário síncronos suportados

A Tradução de Documentos suporta os seguintes tipos de ficheiros de glossário:

Tipo de ficheiro Extensão de nome de ficheiro Description
Valores separados por vírgulas csv Um arquivo de dados brutos delimitado por vírgulas usado por programas de planilha.
XmlLocalizationInterchange xlf , xliff Um formato baseado em XML projetado para padronizar como os dados são passados durante o processo de localização.
TabSeparatedValues tsv, tab Um arquivo de dados brutos delimitado por tabulações usado por programas de planilha.

Limites de Pedidos de Tradução de Documentos

Para obter informações detalhadas sobre os limites de solicitação do Serviço Azure AI Translator, consulteLimites de solicitação de tradução de documentos.

Residência de dados de tradução de documentos

A residência de dados da Tradução de Documentos depende da região do Azure onde o recurso do Translator foi criado:

  • Os recursos do tradutor criados em qualquer região da Europa (exceto na Suíça) são processados no centro de dados no norte da Europa e na Europa Ocidental.
  • Os recursos de tradutores criados em qualquer região da Suíça são processados no data center na Suíça Norte e Suíça Oeste.
  • Os recursos de tradutores criados em qualquer região da Ásia-Pacífico ou Austrália são processados em data centers no Sudeste Asiático e no Leste da Austrália.
  • O recurso de tradutor criado em todas as outras regiões, incluindo Global, América do Norte e América do Sul, é processado no data center no Leste dos EUA e no Oeste dos EUA 2.

✔️ Funcionalidade: Ponto de extremidade do Serviço de Tradução ✔️
de Documentos: Personalizado:
<name-of-your-resource.cognitiveservices.azure.com/translator/text/batch/v1.1

Região do recurso Centro de dados de processamento de pedidos
Qualquer região da Europa (exceto Suíça) Europa: Norte da Europa • Europa Ocidental
Suíça Suíça: Suíça Norte • Suíça Oeste
Qualquer região da Ásia-Pacífico e Austrália Ásia: Sudeste Asiático • Austrália Leste
Todas as outras regiões, incluindo Global, América do Norte e América do Sul EUA: Leste dos EUA • Oeste dos EUA 2

Próximos passos

Em nosso guia de início rápido, você aprende como começar a usar rapidamente a Tradução de Documentos. Para começar, você precisa de uma conta ativa do Azure. Se não tiver uma, poderá criar uma conta gratuita.