Compartir vía


¿Qué es un diccionario?

Un diccionario es un par alineado de documentos que especifica una lista de frases u oraciones y sus traducciones correspondientes. Use un diccionario en el entrenamiento cuando quiera que la aplicación Traductor traduzca todas las instancias de la frase u oración de origen con la traducción que proporcione en el diccionario. A veces, los diccionarios se denominan glosarios o bases terminológicas. Puede pensar en el diccionario como un "copiar y remplazar" a la fuerza para todos los términos incluidos. Además, el servicio Traductor personalizado de Microsoft crea y usa sus propios diccionarios de uso general para mejorar la calidad de su traducción. Pero los un diccionario proporcionado por el cliente tiene prioridad y será el primero que se use para buscar palabras o frases.

Los diccionarios solo funcionan en los proyectos en los pares de idiomas que tengan detrás un modelo de red neuronal general de Microsoft totalmente compatible. Consulte la lista completa de idiomas.

Diccionario de frases

El diccionarios de frases distingue mayúsculas de minúsculas. Se trata de una operación exacta de búsqueda y reemplazo. Al incluir un diccionario de frases durante el entrenamiento de un modelo, todas las palabras y frases incluidas se traducen de la forma especificada. El resto de la oración se traduce como de costumbre. Puede usar un diccionario de frases para especificar las frases que no se deben traducir. Debe especificar la misma frase sin traducir en los archivos de origen y de destino.

Diccionario dinámico

La característica de diccionario dinámico permite personalizar las traducciones de términos o frases específicos. Las traducciones personalizadas se definen para necesidades específicas, de idioma o de contexto únicas.

Diccionario de frases neuronales

El diccionario de frases neuronales amplía nuestras características de diccionario dinámico y diccionario de frases estándar. Los diccionarios dinámico y de frases permiten personalizar la salida de traducción y proporcionan traducciones propias para términos o frases específicos. La característica de diccionario dinámico se usa con Translator API mientras que el diccionario de frases neuronales se habilita mediante Traductor personalizado. El diccionario de frases neuronales mejora la calidad de traducción de las oraciones que incluyen una o varias traducciones de términos, al permitir que el modelo de traducción automática se ajuste tanto al término como al contexto. Este ajuste genera traducciones más fluidas. Al mismo tiempo, conserva la precisión de la traducción a largo plazo.

Diccionario de oraciones

El diccionario de oraciones no distingue mayúsculas de minúsculas. El diccionario de oraciones le permite especificar una traducción exacta de destino para una oración de origen. Para que exista una coincidencia con el diccionario de oraciones, la oración completa que se envíe debe coincidir con la entrada de origen del diccionario. Una entrada del diccionario de origen que termine con un signo de puntuación se omite durante la coincidencia. Si solo coincide una parte de la oración, la entrada no es una coincidencia. Cuando se detecta una coincidencia, se devuelve la entrada de destino del diccionario de oraciones.

Entrenamientos de solo diccionario

Puede entrenar un modelo usando solo los datos de un diccionario. Para ello, seleccione solo el documento del diccionario (o varios documentos del diccionario) que desee incluir y seleccione Crear modelo. Dado que este es un entrenamiento solo del diccionario, no hay un número mínimo de oraciones necesarias. Normalmente, el modelo completa el entrenamiento más rápido que un entrenamiento estándar. Los modelos resultantes usan los modelos base de Microsoft para la traducción, con la adición de los diccionarios que ha agregado. No se obtiene un informe de prueba.

Nota:

Traductor personalizado no alinea las oraciones en archivos de diccionario, por lo que es importante que haya el mismo número de frases u oraciones de origen y destino en el diccionario y que estén alineadas con precisión.

Recomendaciones

  • Los diccionarios no reemplazan al entrenamiento de modelos mediante datos de aprendizaje. Para unos mejores resultados, se recomienda permitir que el sistema aprenda de los datos de entrenamiento. Pero cuando las oraciones o los nombres compuestos se deben traducir al pie de la letra, use un diccionario de frases.

  • El diccionario de frases debe usarse con moderación. Cuando se reemplaza una frase dentro de una oración, el contexto de esa oración se pierde o se ve limitado para continuar con la traducción del resto de la oración. Como resultado, aunque la frase o palabra en la oración se traduce según el diccionario proporcionado, la calidad general de la traducción de la oración a menudo se ve afectada.

  • El diccionario de frases funciona bien para los nombres compuestos, como nombres de producto ("Microsoft SQL Server"), nombres propios ("Ciudad de Hamburgo") o las características del producto ("tabla dinámica"). No funciona igual de bien en el caso de los verbos o adjetivos, ya que normalmente esas palabras están muy relacionadas con el contexto en el idioma de origen o en el de destino. El procedimiento recomendado es agregar al diccionario de frases solamente nombres compuestos.

  • Si usa un diccionario de frases, las mayúsculas y los signos de puntuación son importantes. Las entradas del diccionario distinguen mayúsculas de minúsculas y signos de puntuación. El servicio Traductor personalizado solo hace coincidir las palabras y frases de la oración de entrada que usen exactamente las mismas mayúsculas, minúsculas y signos de puntuación que se especifican en el archivo de diccionario de origen. Además, las traducciones reflejan tanto las mayúsculas y minúsculas como los signos de puntuación proporcionados en el archivo de diccionario de destino.

    Los

    • Imagine que va a entrenar un sistema de inglés a español que usa un diccionario de frases y especifica SQL server en el archivo de origen y Microsoft SQL Server en el archivo de destino. Cuando solicite la traducción de una oración que contenga la frase SQL server, el servicio Traductor personalizado hace coincidir la entrada del diccionario y la traducción que contiene Microsoft SQL Server.
    • Cuando solicite la traducción de una oración que incluya la misma frase, pero no coincida con lo que se encuentra en el archivo de origen, como sql server, sql Server o SQL Server, no devolverá una coincidencia del diccionario.
    • La traducción sigue las reglas del idioma de destino tal y como se especifica en el diccionario de frases.
  • Para más información sobre el diccionario de frases neuronales, vea guía y recomendaciones del diccionario neuronal.

  • Si usa un diccionario de oraciones, se omite la puntuación final de la oración.

    Ejemplo

    • Si el diccionario de origen contiene "¡Esta oración termina con un signo de puntuación!", coinciden todas las solicitudes de traducción que contengan "Esta oración termina con un signo de puntuación".
  • El diccionario debe contener líneas de origen únicas. Si una línea de origen (una palabra, frase u oración) aparece más de una vez en un archivo de diccionario, el sistema siempre usa la última entrada proporcionada y devuelve el destino cuando se encuentre una coincidencia.

  • Evite agregar al archivo de diccionario de origen frases que consten solo de números o que sean palabras de dos o tres letras, como acrónimos.

Pasos siguientes