Partilhar via


Habilidade cognitiva de tradução de texto

A habilidade Tradução de texto avalia o texto e, para cada registro, retorna o texto traduzido para o idioma de destino especificado. Essa habilidade usa a API de Texto do Tradutor v3.0 disponível nos serviços de IA do Azure.

Esse recurso é útil se você espera que seus documentos não estejam todos em um idioma, caso em que você pode normalizar o texto para um único idioma antes de indexar para pesquisa traduzindo-o. Também é útil para casos de uso de localização, onde você pode querer ter cópias do mesmo texto disponíveis em vários idiomas.

A API de Texto do Tradutor v3.0 é um serviço de IA do Azure não regional, o que significa que não é garantido que seus dados permaneçam na mesma região que sua Pesquisa de IA do Azure ou recurso de serviços de IA do Azure anexado.

Nota

Essa habilidade está vinculada aos serviços de IA do Azure e requer um recurso faturável para transações que excedam 20 documentos por indexador por dia. A execução de habilidades internas é cobrada pelo preço pré-pago dos serviços de IA do Azure existentes.

Ao usar essa habilidade, todos os documentos na fonte são processados e cobrados pela tradução, mesmo que os idiomas de origem e de destino sejam os mesmos. Esse comportamento é útil para suporte a vários idiomas dentro do mesmo documento, mas pode resultar em processamento desnecessário. Para evitar cobranças inesperadas de documentos que não precisam de processamento, mova-os para fora do contêiner da fonte de dados antes de executar a habilidade.

@odata.type

Microsoft.Skills.Text.TranslationSkill

Limites de dados

O tamanho máximo de um registo deve ser de 50 000 carateres, medido por String.Length. Se você precisar dividir seus dados antes de enviá-los para a habilidade de tradução de texto, considere usar a habilidade Divisão de texto. Se você usar uma habilidade de divisão de texto, defina o comprimento da página como 5000 para obter o melhor desempenho.

Parâmetros de habilidade

Os parâmetros diferenciam maiúsculas de minúsculas.

Entradas Description
defaultToLanguageCode (Obrigatório) O código de idioma para traduzir documentos para documentos que não especificam o idioma "para" explicitamente.
Veja a lista completa de linguagens suportadas.
defaultFromLanguageCode (Opcional) O código de idioma para traduzir documentos de documentos que não especificam o idioma "de" explicitamente. Se defaultFromLanguageCode não for especificado, a deteção automática de idioma fornecida pela API de texto do tradutor será usada para determinar o idioma "de".
Veja a lista completa de linguagens suportadas.
sugeridoDe (Opcional) O código de idioma para traduzir documentos se fromLanguageCode ou defaultFromLanguageCode não forem especificados e a deteção automática de idioma não for bem-sucedida. Se o idioma sugerido não for especificado, o inglês (en) será usado como o idioma sugeridoDe.
Veja a lista completa de linguagens suportadas.

Contributos para as competências

Nome de entrada Description
texto O texto a traduzir.
paraLanguageCode Uma cadeia de caracteres que indica o idioma para o qual o texto deve ser traduzido. Se essa entrada não for especificada, o defaultToLanguageCode será usado para traduzir o texto.
Veja a lista completa de linguagens suportadas.
deLanguageCode Uma cadeia de caracteres que indica o idioma atual do texto. Se esse parâmetro não for especificado, o defaultFromLanguageCode (ou a deteção automática de idioma se o defaultFromLanguageCode não for fornecido) será usado para traduzir o texto.
Veja a lista completa de linguagens suportadas.

Resultados em termos de competências

Nome da saída Description
traduzidoTexto O resultado da cadeia de caracteres da tradução de texto do traduzidoFromLanguageCode para o traduzidoToLanguageCode.
traduzidoToLanguageCode Uma cadeia de caracteres que indica o código do idioma para o qual o texto foi traduzido. Útil se você estiver traduzindo para vários idiomas e quiser ser capaz de acompanhar qual texto é qual idioma.
traduzidoFromLanguageCode Uma cadeia de caracteres que indica o código de idioma do qual o texto foi traduzido. Útil se você optou pela opção de deteção automática de idioma, pois essa saída lhe dará o resultado dessa deteção.

Definição da amostra

 {
    "@odata.type": "#Microsoft.Skills.Text.TranslationSkill",
    "defaultToLanguageCode": "fr",
    "suggestedFrom": "en",
    "context": "/document",
    "inputs": [
      {
        "name": "text",
        "source": "/document/text"
      }
    ],
    "outputs": [
      {
        "name": "translatedText",
        "targetName": "translatedText"
      },
      {
        "name": "translatedFromLanguageCode",
        "targetName": "translatedFromLanguageCode"
      },
      {
        "name": "translatedToLanguageCode",
        "targetName": "translatedToLanguageCode"
      }
    ]
  }

Entrada de exemplo

{
  "values": [
    {
      "recordId": "1",
      "data":
        {
          "text": "We hold these truths to be self-evident, that all men are created equal."
        }
    },
    {
      "recordId": "2",
      "data":
        {
          "text": "Estamos muy felices de estar con ustedes."
        }
    }
  ]
}

Saída de exemplo

{
  "values": [
    {
      "recordId": "1",
      "data":
        {
          "translatedText": "Nous tenons ces vérités pour évidentes, que tous les hommes sont créés égaux.",
          "translatedFromLanguageCode": "en",
          "translatedToLanguageCode": "fr"
        }
    },
    {
      "recordId": "2",
      "data":
        {
          "translatedText": "Nous sommes très heureux d'être avec vous.",
          "translatedFromLanguageCode": "es",
          "translatedToLanguageCode": "fr"
        }
    }
  ]
}

Erros e avisos

Se você fornecer um código de idioma não suportado para o idioma "para" ou "de", um erro será gerado e o texto não será traduzido. Se o seu texto estiver vazio, será produzido um aviso. Se o texto tiver mais de 50.000 caracteres, apenas os primeiros 50.000 caracteres serão traduzidos e um aviso será emitido.

Consulte também