Termos da chave do Tradutor Personalizado

A tabela seguinte apresenta uma lista dos termos-chave que poderá encontrar à medida que trabalha com o Tradutor Personalizado.

Word ou Expressão Definição
Idioma de Origem O idioma de origem é o idioma inicial que pretende converter noutro idioma (o "destino").
Idioma de Destino O idioma de destino é o idioma que pretende que a tradução automática forneça depois de receber o idioma de origem.
Ficheiro Monolingual Um ficheiro monolingual tem um único idioma não emparelhado com outro ficheiro de um idioma diferente.
Ficheiros Paralelos Um ficheiro paralelo é uma combinação de dois ficheiros com texto correspondente. Um ficheiro tem o idioma de origem. O outro tem o idioma de destino.
Alinhamento da Frase O conjunto de dados paralelo tem de ter frases alinhadas com frases que representam o mesmo texto em ambos os idiomas. Por exemplo, num ficheiro paralelo de origem, a primeira frase deve, em teoria, mapear para a primeira frase no ficheiro paralelo de destino.
Texto Alinhado Um dos passos mais importantes da validação de ficheiros é alinhar as frases nos documentos paralelos. As coisas são expressas de forma diferente em idiomas diferentes. Também os idiomas diferentes têm diferentes encomendas de palavras. Este passo faz o trabalho de alinhar as frases com o mesmo conteúdo para que possam ser utilizadas para preparação. Um alinhamento de frases baixas indica que pode haver algo de errado com um ou ambos os ficheiros.
Word Breaking/Unbreaking Word quebra é a função de marcar os limites entre palavras. Muitos sistemas de escrita utilizam um espaço para denotar o limite entre palavras. Word desanuvio refere-se à remoção de qualquer marcador visível que possa ter sido inserido entre palavras num passo anterior.
Delimitadores Os delimitadores são as formas como uma frase é dividida em segmentos ou delimita a margem entre frases. Por exemplo, em espaços ingleses delimitam palavras, dois pontos e ponto e ponto e vírgula delimitam cláusulas e períodos delimitam frases.
Ficheiros de Formação Um ficheiro de preparação é utilizado para ensinar o sistema de tradução automática a mapear de um idioma (a origem) para um idioma de destino (o destino). Quanto mais dados fornecer, melhor será o desempenho do sistema.
Otimizar Ficheiros Estes ficheiros são, muitas vezes, derivados aleatoriamente do conjunto de preparação (se não selecionar um conjunto de ajuste). As frases são selecionadas automaticamente e utilizadas para otimizar o sistema e garantir que está a funcionar corretamente. Se quiser criar um modelo de tradução para fins gerais e criar os seus próprios ficheiros de otimização, certifique-se de que são um conjunto aleatório de frases entre domínios
Testar Ficheiros Estes ficheiros são, muitas vezes, ficheiros derivados, selecionados aleatoriamente no conjunto de preparação (se não selecionar nenhum conjunto de testes). O objetivo destas frases é avaliar a precisão do modelo de tradução. Para se certificar de que o sistema traduz estas frases com precisão, pode querer criar um conjunto de testes e carregá-lo para o tradutor. Ao fazê-lo, garantirá que as frases são utilizadas na avaliação do sistema (a geração de uma classificação BLEU).
Ficheiro de combinação Um tipo de ficheiro no qual as frases de origem e traduzidas estão contidas no mesmo ficheiro. Formatos de ficheiro suportados (TMX, XLIFF, XLF, ICI e XLSX).
Ficheiro de arquivo Um ficheiro que contém outros ficheiros. Formatos de ficheiro suportados (zip, gz, tgz).
Classificação de BLEU O BLEU é o método padrão da indústria para avaliar a "precisão" ou a precisão do modelo de tradução. Embora existam outros métodos de avaliação, o Microsoft Translator baseia-se no método BLEU para comunicar a precisão aos Proprietários do Projeto.