Share via


Criar e gerenciar documentos de treinamento

O Tradutor Personalizado habilita a criação de modelos de tradução que refletem a terminologia e estilo específicos do seu domínio, setor e negócio. O treinamento e a implantação de um modelo personalizado são fáceis e não exigem habilidades de programação. O Tradutor Personalizado permite carregar arquivos paralelos, arquivos de memória de tradução ou arquivos zip.

Os Documentos paralelos são pares de documentos, sendo um uma tradução (destino) do outro (origem). Um documento no par contém frases no idioma de origem e o outro documento contém essas frases traduzidas no idioma de destino.

Antes de carregar seus documentos, revise as diretrizes de convenção de nomenclatura e formatos de documento para garantir que o formato do arquivo é compatível com o Tradutor Personalizado.

Como criar conjuntos de documentos

Localizar dados de qualidade no domínio geralmente é uma tarefa desafiadora que varia de acordo com a classificação do usuário. Estas são algumas perguntas que você pode se fazer ao avaliar quais dados podem estar disponíveis para você:

  • As empresas geralmente têm uma grande quantidade de dados de tradução que se acumularam ao longo de muitos anos usando a tradução humana. Sua empresa tem dados de tradução anteriores disponíveis que você pode usar?

  • Você tem uma amplo volume de dados monolíngues? Dados monolíngues são dados em apenas um idioma. Nesse caso, é possível obter traduções para esses dados?

  • Você pode rastrear portais online para coletar frases de origem e sintetizar frases de destino?

Material de treinamento para todos os tipos de documento

Origem O que faz Regras a seguir
Documentos de treinamento bilíngue Ensina ao sistema sua terminologia e estilo. Seja liberal. Qualquer tradução humana no domínio é melhor do que a tradução automática. Adicione e remova documentos conforme o uso e tente melhorar a pontuação BLEU.
Ajustar documentos Treina os parâmetros da Tradução Automática Neural. Seja estrito. Redija-os para que sejam idealmente representativos do que você vai traduzir no futuro.
Documentos de teste Calcule a pontuação BLEU. Seja estrito. Redija documentos de teste para serem idealmente representativos do que você planeja traduzir no futuro.
Dicionário de frase Força a tradução especificada 100% do tempo. Seja restritivo. Um dicionário de frases diferencia maiúsculas de minúsculas e toda palavra ou frase listada é traduzida da forma que você especificar. Em muitos casos, é melhor não usar um dicionário de frases e, em vez disso, permitir que o sistema aprenda o conteúdo.
Dicionário de frases Força a tradução especificada 100% do tempo. Seja estrito. Um dicionário de frases não diferencia maiúsculas de minúsculas e é bom para frases curtas comuns no domínio. Para que uma correspondência de dicionário de sentença ocorra, toda a sentença enviada deve corresponder à entrada do dicionário de origem. Se apenas uma parte da sentença corresponder, a entrada não será igual.

Como carregar documentos

Os tipos de documento são associados ao par de idiomas selecionado ao criar um projeto.

  1. Entrar no portal do Tradutor Personalizado. O espaço de trabalho padrão é carregado e uma lista de projetos criados é exibida.

  2. Selecione o nome do projeto desejado. Por padrão, a folha Gerenciar documentos é selecionada e é exibida uma lista de documentos carregados anteriormente.

  3. Selecione Adicionar conjunto de documentos e escolha o tipo de documento:

    • Conjunto de treinamento
    • Conjunto de testes
    • Conjunto de ajustes
    • Conjunto de dicionários:
      • Dicionário de Frases
      • Dicionário de Sentenças
  4. Selecione Avançar.

    Captura de tela ilustrando o link de upload do documento.

    Observação

    Escolher o conjunto de dicionários inicializa o diálogo Escolher o tipo de dicionário. Escolha um e selecione Avançar

  5. Selecione o formato dos documentos nos botões de opção.

    Captura de tela ilustrando a página de upload do documento.

    • Em Documentos paralelos, preencha o Document set name e selecione Procurar arquivos para selecionar documentos de origem e de destino.
    • Para arquivo de MT (memória de tradução) ou Carregar vários conjuntos com ZIP, selecione Procurar arquivos para selecionar o arquivo
  6. Escolha Carregar.

Neste ponto, o Tradutor Personalizado está processando seus documentos e tentando extrair frases conforme indicado na notificação de carregamento. Ao concluir o processamento, você verá a notificação de upload bem-sucedido.

Captura de tela ilustrando a janela da caixa de diálogo de processamento de upload de documentos.

Exibir o histórico de upload

Na página do workspace, você pode ver o histórico de todos os detalhes dos uploads de documentos, como tipo de documento, par de idiomas, status de upload, etc.

  1. No página do workspace do portal Tradutor Personalizado, clique na guia Histórico de uploads para visualizar o histórico.

    Captura de tela mostrando a guia histórico de upload.

  2. Esta página mostra o status de todos os seus últimos envios. Ele exibe os uploads do mais recente para o menos recente. Para cada upload, ele mostra o nome do documento, o status do upload, a data de envio, o número de arquivos enviados, o tipo de arquivo enviado, o par de idiomas do arquivo e quem criou o arquivo. Você pode usar um Filtro para localizar documentos rapidamente por nome, status, idioma e intervalo de datas.

    Captura de tela mostrando a página histórico de upload.

  3. Selecione qualquer registro de histórico de upload. Na página de detalhes do histórico de uploads, você pode visualizar os arquivos enviados como parte do upload, status de upload do arquivo, idioma do arquivo e mensagem de erro (se houver algum erro no upload).

Próximas etapas