Termos da chave do Tradutor Personalizado
A tabela seguinte apresenta uma lista dos termos-chave que poderá encontrar à medida que trabalha com o Tradutor Personalizado.
Word ou Expressão | Definição |
---|---|
Idioma de Origem | O idioma de origem é o idioma inicial que pretende converter noutro idioma (o "destino"). |
Idioma de Destino | O idioma de destino é o idioma que pretende que a tradução automática forneça depois de receber o idioma de origem. |
Ficheiro Monolingual | Um ficheiro monolingual tem um único idioma não emparelhado com outro ficheiro de um idioma diferente. |
Ficheiros Paralelos | Um ficheiro paralelo é uma combinação de dois ficheiros com texto correspondente. Um ficheiro tem o idioma de origem. O outro tem o idioma de destino. |
Alinhamento da Frase | O conjunto de dados paralelo tem de ter frases alinhadas com frases que representam o mesmo texto em ambos os idiomas. Por exemplo, num ficheiro paralelo de origem, a primeira frase deve, em teoria, mapear para a primeira frase no ficheiro paralelo de destino. |
Texto Alinhado | Um dos passos mais importantes da validação de ficheiros é alinhar as frases nos documentos paralelos. As coisas são expressas de forma diferente em idiomas diferentes. Também os idiomas diferentes têm diferentes encomendas de palavras. Este passo faz o trabalho de alinhar as frases com o mesmo conteúdo para que possam ser utilizadas para preparação. Um alinhamento de frases baixas indica que pode haver algo de errado com um ou ambos os ficheiros. |
Word Breaking/Unbreaking | Word quebra é a função de marcar os limites entre palavras. Muitos sistemas de escrita utilizam um espaço para denotar o limite entre palavras. Word desanuvio refere-se à remoção de qualquer marcador visível que possa ter sido inserido entre palavras num passo anterior. |
Delimitadores | Os delimitadores são as formas como uma frase é dividida em segmentos ou delimita a margem entre frases. Por exemplo, em espaços ingleses delimitam palavras, dois pontos e ponto e ponto e vírgula delimitam cláusulas e períodos delimitam frases. |
Ficheiros de Formação | Um ficheiro de preparação é utilizado para ensinar o sistema de tradução automática a mapear de um idioma (a origem) para um idioma de destino (o destino). Quanto mais dados fornecer, melhor será o desempenho do sistema. |
Otimizar Ficheiros | Estes ficheiros são, muitas vezes, derivados aleatoriamente do conjunto de preparação (se não selecionar um conjunto de ajuste). As frases são selecionadas automaticamente e utilizadas para otimizar o sistema e garantir que está a funcionar corretamente. Se quiser criar um modelo de tradução para fins gerais e criar os seus próprios ficheiros de otimização, certifique-se de que são um conjunto aleatório de frases entre domínios |
Testar Ficheiros | Estes ficheiros são, muitas vezes, ficheiros derivados, selecionados aleatoriamente no conjunto de preparação (se não selecionar nenhum conjunto de testes). O objetivo destas frases é avaliar a precisão do modelo de tradução. Para se certificar de que o sistema traduz estas frases com precisão, pode querer criar um conjunto de testes e carregá-lo para o tradutor. Ao fazê-lo, garantirá que as frases são utilizadas na avaliação do sistema (a geração de uma classificação BLEU). |
Ficheiro de combinação | Um tipo de ficheiro no qual as frases de origem e traduzidas estão contidas no mesmo ficheiro. Formatos de ficheiro suportados (TMX, XLIFF, XLF, ICI e XLSX). |
Ficheiro de arquivo | Um ficheiro que contém outros ficheiros. Formatos de ficheiro suportados (zip, gz, tgz). |
Classificação de BLEU | O BLEU é o método padrão da indústria para avaliar a "precisão" ou a precisão do modelo de tradução. Embora existam outros métodos de avaliação, o Microsoft Translator baseia-se no método BLEU para comunicar a precisão aos Proprietários do Projeto. |