Uso de glosarios con traducción de documentos

Un glosario es una lista de términos con definiciones que se crean para que el servicio de traducción de documentos se use durante el proceso de traducción. Actualmente, la característica de glosario admite la traducción de idioma de origen a destino de uno a uno. Algunos casos de uso comunes en los glosarios son:

  • Terminología específica según el contexto. Cree un glosario que designe significados específicos para un contexto determinado.

  • No se traduce. Por ejemplo, puede restringir la traducción de documentos de las marcas de nombre de producto mediante un glosario con el mismo texto de origen y destino.

  • Traducciones especificadas para palabras ambiguas. Elija una traducción específica para palabras polisémicas.

Creación, carga y uso de un archivo de glosario

  1. Cree un archivo de glosario. Cree un archivo en un formato admitido (preferiblemente valores separados por tabulaciones) que contenga todos los términos y frases que quiera usar en la traducción.

    Para comprobar si se admite el formato de archivo, consulteObtención de formatos de glosario admitidos.

    El siguiente glosario de origen inglés contiene palabras que pueden tener significados diferentes en función del contexto en el que se usen. El glosario proporciona la traducción esperada para cada palabra del archivo para ayudar a garantizar la precisión.

    Por ejemplo, cuando la palabra Bank aparece en un documento financiero, debe traducirse para reflejar su significado financiero. Si la palabra Bank aparece en un documento geográfico, puede referirse a la costa para reflejar su significado topográfico. Del mismo modo, la palabra Crane puede hacer referencia a un pájaro o a una máquina.

    El archivo TSV es un glosario de ejemplo: inglés a francés

       Bank     Banque
       Card     Carte
       Crane    Grue
       Office   Office
       Tiger    Tiger
       US       United States
    
  2. Cargue el glosario en Azure Storage. Para completar este paso, necesita una cuenta de Azure Blob Storage con contenedores para almacenar y organizar los datos de blob dentro de la cuenta de almacenamiento.

  3. Especifique el glosario en la solicitud de traducción. Incluya glossary URL, format y version en la solicitud POST:

    {
        "inputs": [
            {
                "source": {
                    "sourceUrl": "https://my.blob.core.windows.net/source-en"
                },
                "targets": [
                    {
                         "targetUrl": "https://my.blob.core.windows.net/target-fr",
                        "language": "fr",
                        "glossaries": [
                            {
                                "glossaryUrl": "https://my.blob.core.windows.net/glossaries/en-fr.tsv",
                                "format": "tsv"
                            }
                        ]
    
                    }
                ]
            }
        ]
    }
    

    Nota:

    En el ejemplo se usó una identidad administrada asignada por el sistema habilitada con una asignación de roles colaborador de datos de blobs de almacenamiento para la autorización. Para obtener más información, consulteIdentidades administradas para la traducción de documentos.

Distinción entre mayúsculas y minúsculas

De forma predeterminada, la API del Traductor de Azure AI distingue mayúsculas de minúsculas, lo que significa que coincide con los términos del texto de origen en función de mayúsculas y minúsculas.

  • Aplicación de oraciones parciales. Cuando el glosario se aplica a parte de una oración, el API de traducción de documentos comprueba si el término del glosario coincide con el caso en el texto de origen. Si el uso de mayúsculas y minúsculas no coincide, no se aplica el glosario.

  • Aplicación de oración completa. Cuando el glosario se aplica a una oración completa, el servicio no distingue mayúsculas de minúsculas. Coincide con el término del glosario independientemente de su caso en el texto de origen. Esta disposición aplica los resultados correctos para los casos de uso que implican expresiones y comillas.

Pasos siguientes

Pruebe la guía paso a paso de traducción de documentos para traducir de forma asincrónica documentos completos mediante un lenguaje de programación de su elección: