Compartir a través de


Aptitud cognitiva Text Translation

La aptitud Text Translation evalúa el texto y, para cada registro, devuelve el texto traducido al idioma de destino especificado. Esta aptitud usa Translator Text API v3.0, que está disponible en los servicios de Azure AI.

Esta funcionalidad es útil si espera que los documentos no estén en un único idioma, en cuyo caso puede normalizar el texto a un solo idioma antes de la indexación para la búsqueda mediante su traducción. También es útil para los casos de uso de localización, en los que puede que desee tener copias del mismo texto disponibles en varios idiomas.

Translator Text API v3.0 es un servicio de Azure AI no regional, lo que significa que no se garantiza que los datos permanezcan en la misma región que Azure AI Search o el recurso de servicios de Azure AI asociado.

Nota:

Esta aptitud está enlazada a los servicios de Azure AI y necesita un recurso facturable para las transacciones que superan los 20 documentos por indexador al día. La ejecución de aptitudes integradas se carga al actual precio de pago por uso de los servicios de Azure AI.

Al usar esta aptitud, todos los documentos del origen se procesan y facturan por traducción, incluso si los idiomas de origen y destino son los mismos. Este comportamiento es útil para la compatibilidad con varios idiomas dentro del mismo documento, pero puede dar lugar a un procesamiento innecesario. Para evitar cargos de facturación inesperados de documentos que no necesitan procesamiento, sáquelos del contenedor de origen de datos antes de ejecutar la aptitud.

@odata.type

Microsoft.Skills.Text.TranslationSkill

Límites de datos

El tamaño máximo de un registro debe tener menos de 50 000 caracteres según la medición de String.Length. Si tiene que dividir los datos antes de enviarlos a la aptitud Text Translation, puede usar la aptitud Text Split. Si usa una aptitud de división de texto, establezca la longitud de la página en 5000 para obtener el mejor rendimiento.

Parámetros de la aptitud

Los parámetros distinguen mayúsculas de minúsculas.

Entradas Descripción
defaultToLanguageCode (Obligatorio) Código de idioma al que traducir los documentos para aquellos documentos que no especifican el idioma de destino explícitamente.
Vea Full list of supported languages (Lista completa de idiomas admitidos).
defaultFromLanguageCode (Opcional) Código de idioma desde el que traducir los documentos para aquellos documentos que no especifican el idioma de origen explícitamente. Si no se especifica defaultFromLanguageCode, se usará la detección automática de idioma proporcionada por Translator Text API para determinar el idioma de origen.
Vea Full list of supported languages (Lista completa de idiomas admitidos).
suggestedFrom (Opcional) Código de idioma desde el que traducir los documentos si no se especifica fromLanguageCode o defaultFromLanguageCode, o se produce un error en la detección automática del idioma. Si no se especifica el idioma de suggestedFrom, se usará el inglés (en) como idioma.
Vea Full list of supported languages (Lista completa de idiomas admitidos).

Entradas de la aptitud

Nombre de entrada Descripción
text Texto que se va a traducir.
toLanguageCode Cadena que indica el idioma al que se debe traducir el texto. Si no se especifica esta entrada, se usará defaultToLanguageCode para traducir el texto.
Vea Full list of supported languages (Lista completa de idiomas admitidos).
fromLanguageCode Cadena que indica el idioma actual del texto. Si no se especifica este parámetro, se utilizará defaultFromLanguageCode (o la detección automática de idioma si no se proporciona defaultFromLanguageCode) para traducir el texto.
Vea Full list of supported languages (Lista completa de idiomas admitidos).

Salidas de la aptitud

Nombre de salida Descripción
translatedText Cadena resultante de la traducción del texto desde translatedFromLanguageCode a translatedToLanguageCode.
translatedToLanguageCode Cadena que indica el código de idioma al que se ha traducido el texto. Resulta útil si va a traducir a varios idiomas y desea poder realizar un seguimiento del idioma de cada texto.
translatedFromLanguageCode Cadena que indica el código de idioma desde el que se ha traducido el texto. Resulta útil si opta por la opción de detección automática de idioma, ya que esta salida le dará el resultado de dicha detección.

Definición de ejemplo

 {
    "@odata.type": "#Microsoft.Skills.Text.TranslationSkill",
    "defaultToLanguageCode": "fr",
    "suggestedFrom": "en",
    "context": "/document",
    "inputs": [
      {
        "name": "text",
        "source": "/document/text"
      }
    ],
    "outputs": [
      {
        "name": "translatedText",
        "targetName": "translatedText"
      },
      {
        "name": "translatedFromLanguageCode",
        "targetName": "translatedFromLanguageCode"
      },
      {
        "name": "translatedToLanguageCode",
        "targetName": "translatedToLanguageCode"
      }
    ]
  }

Entrada de ejemplo

{
  "values": [
    {
      "recordId": "1",
      "data":
        {
          "text": "We hold these truths to be self-evident, that all men are created equal."
        }
    },
    {
      "recordId": "2",
      "data":
        {
          "text": "Estamos muy felices de estar con ustedes."
        }
    }
  ]
}

Salida de ejemplo

{
  "values": [
    {
      "recordId": "1",
      "data":
        {
          "translatedText": "Nous tenons ces vérités pour évidentes, que tous les hommes sont créés égaux.",
          "translatedFromLanguageCode": "en",
          "translatedToLanguageCode": "fr"
        }
    },
    {
      "recordId": "2",
      "data":
        {
          "translatedText": "Nous sommes très heureux d'être avec vous.",
          "translatedFromLanguageCode": "es",
          "translatedToLanguageCode": "fr"
        }
    }
  ]
}

Errores y advertencias

Si proporciona un código de idioma no admitido para el lenguaje de origen o destino, se genera un error y no se traduce el texto. Si el texto está vacío, se creará una advertencia. Si el texto tiene más de 50 000 caracteres, solo se traducirán los primeros 50 000 caracteres y se emitirá una advertencia.

Consulte también