Compartir a través de


¿Qué es Azure Translator en la traducción de documentos de Foundry Tools?

La traducción de documentos es una característica de traducción automática basada en la nube de Azure Translator. Puede traducir varios documentos complejos en todos los idiomas y dialectos admitidos conservando la estructura y el formato de datos originales de los documentos. La API de traducción de documentos admite dos procesos de traducción:

  • La traducción por lotes asincrónica admite el procesamiento de varios documentos y archivos grandes. El proceso de traducción por lotes requiere una cuenta de Azure Blob Storage con contenedores de almacenamiento para los documentos de origen y traducidos.

  • El archivo único sincrónico admite el procesamiento de traducciones de archivos únicos. El proceso de traducción de archivos no requiere una cuenta de Azure Blob Storage. La respuesta final contiene el documento traducido y se devuelve directamente al cliente que realiza la llamada.

Opciones de desarrollo de traducción de documentos

Agregue la traducción de documentos a los proyectos y aplicaciones mediante los siguientes recursos:

Traducción asincrónica
Opción de desarrollo Descripción
REST API La API REST es una interfaz independiente del lenguaje que permite crear solicitudes HTTP y encabezados de autorización para traducir documentos.
Bibliotecas cliente (SDK) La biblioteca cliente (SDK) son clases, objetos, métodos y código específicos del lenguaje que puede usar rápidamente agregando una referencia en el proyecto. Actualmente, la traducción de documentos admite lenguajes de programación para C#/.NET y Python.
Traducción sincrónica

Utilice la traducción sincrónica de documentos para convertir contenido textual en tiempo real de un idioma a otro, conservando la estructura y el formato originales.

Opción de desarrollo Descripción
Microsoft Foundry El portal de Foundry (clásico) es una plataforma de inteligencia artificial basada en la nube que admite proyectos basados en concentradores y otros tipos de recursos.

Foundry (nuevo) portal es una plataforma de inteligencia artificial basada en la nube que proporciona acceso simplificado a modelos, agentes y herramientas de Foundry a través de proyectos de Foundry.
REST API Integre la traducción sincrónica de documentos en las aplicaciones mediante la API REST.
Bibliotecas cliente (SDK) Introducción a la integración de funcionalidades de traducción en las aplicaciones nuestro SDK de Python.
Contenedor de Docker • Para utilizar el contenedor del Traductor, debe completar y enviar el formulario de solicitud en línea de la aplicación de Foundry Tools para los Servicios privados para que se apruebe el acceso al contenedor.
• La imagen de contenedor de Translator admite características limitadas en comparación con las ofertas en la nube.
Para obtener más información, consulteContenedor: Traducir documentos.

Traducción asincrónica por lotes

Utilice flujos de trabajo asincrónicos para paralelizar la traducción de varios documentos y archivos grandes, maximizando la eficacia.

Características clave de la traducción por lotes

Característica Descripción
Traducir archivos grandes Traducir documentos completos de forma asincrónica.
Traducir numerosos archivos Traduzca varios archivos entre todos los idiomas y dialectos admitidos manteniendo la estructura del documento y el formato de los datos.
Traduzca texto insertado en imágenes en documentos 🆕 . Esta característica está disponible con la API de traducción de documentos en lote para el formato de archivo .
Conservar la presentación del archivo de origen Traducir archivos conservando el diseño y el formato originales.
Aplicar traducción personalizada Traducir documentos con modelos de traducción personalizada y general.
Aplicar glosarios personalizados Traducir documentos mediante glosarios personalizados.
Detectar automáticamente el idioma del documento Deje que el servicio de traducción de documentos determine el idioma del documento.
Traducir documentos con contenido en varios idiomas Use la característica de detección automática para traducir documentos con contenido en varios idiomas al idioma de destino.

Opciones de desarrollo de la traducción por lotes

Puede agregar traducción de documentos a las aplicaciones mediante los siguientes recursos:

Opción de desarrollo Descripción
Portal de Foundry (nuevo) Foundry (nuevo) es una plataforma de inteligencia artificial basada en la nube que proporciona acceso simplificado a los modelos, agentes y herramientas de Foundry a través de proyectos de Foundry.
Portal de Foundry (clásico) Foundry (clásico) es una plataforma basada en la nube que admite proyectos basados en concentradores y otros tipos de recursos.
API REST o biblioteca cliente (SDK de Azure) Integre la traducción en las aplicaciones mediante la API REST o los SDK de biblioteca cliente. Actualmente, la traducción de documentos admite lenguajes de programación para C#/.NET y Python

Formatos de documento admitidos por la traducción por lotes

El método Get supported document formats devuelve una lista de formatos de documento admitidos por el servicio de traducción de documentos. La lista incluye la extensión de archivos común y el tipo de contenido si se usa la API de carga.

Tipo de archivo Extensión de archivo Descripción
PDF de Adobe pdf Formato de archivo de documento portátil. La traducción de documentos usa tecnología de reconocimiento óptico de caracteres (OCR) para extraer y traducir texto en el documento PDF escaneado mientras conserva el diseño original.
Valores separados por comas csv Archivo de datos sin formato delimitados por comas que usan los programas de hoja de cálculo.
HTML html, htm Lenguaje de marcado de hipertexto
XML Formato de archivo de intercambio de localización xlff Formato de documento paralelo que se exporta desde los sistemas de memoria de traducción. Los idiomas utilizados se definen dentro del archivo.
Markdown markdown, mdown, mkdn, md, mkd, mdwn, mdtxt, mdtextrmd Lenguaje de incremento ligero para crear texto con formato.
M​HTML mhtml, mht Formato de archivo de página web que se usa para combinar código HTML y sus recursos complementarios.
Microsoft Excel xls, xlsx Archivo de hoja de cálculo para el análisis de datos y la documentación
Microsoft Outlook msg Mensaje de correo electrónico creado o guardado en Microsoft Outlook
Microsoft PowerPoint ppt, pptx Archivo de presentación utilizado para mostrar contenido en formato de presentación
Microsoft Word doc, docx Archivo de documento de texto
Texto de OpenDocument odt Archivo de documento de texto de código abierto.
Presentación de OpenDocument odp Archivo de presentación de código abierto.
Hoja de cálculo de OpenDocument ods Archivo de hoja de cálculo de código abierto.
Formato de texto enriquecido rtf Documento de texto que incluye formato.
Valores separados por tabulación/TAB tsv/tab Archivo de datos sin formato delimitado por tabulaciones que usan los programas de hoja de cálculo.
Texto txt Documento de texto sin formato

Tipos de archivo heredados de Batch

Los tipos de archivo de origen se conservarán durante la traducción de documentos con las excepciones siguientes:

Extensión del archivo de origen Extensión del archivo traducido
.doc, .odt, .rtf, .docx
.xls, .ods .xlsx
.ppt, .odp .pptx

Formatos de glosario admitidos de la traducción por lotes

La traducción de documentos admite los siguientes tipos de archivo de glosario:

Tipo de archivo Extensión de archivo Descripción
Valores separados por comas csv Archivo de datos sin formato delimitados por comas que usan los programas de hoja de cálculo.
XML Formato de archivo de intercambio de localización xlf , xliff Formato de documento paralelo, exportación de sistemas de memoria de traducción. Los idiomas usados se definen dentro del archivo.
Valores separados por tabulaciones/TAB tsv, tab Archivo de datos sin formato delimitado por tabulaciones que usan los programas de hoja de cálculo.

Traducción sincrónica

Use el procesamiento de traducción sincrónica para enviar un documento como parte del cuerpo de la solicitud HTTP y recibir el documento traducido en la respuesta HTTP.

Características clave de la traducción sincrónica

Característica Descripción
Traducir archivos de una sola página La solicitud sincrónica solo acepta un único documento como entrada.
Conservar la presentación del archivo de origen Traducir archivos conservando el diseño y el formato originales.
Aplicar traducción personalizada Traducir documentos con modelos de traducción personalizada y general.
Aplicar glosarios personalizados Traducir documentos mediante glosarios personalizados.
Traducción de un único idioma Traducir a y desde un idioma admitido.
Detectar automáticamente el idioma del documento Deje que el servicio de traducción de documentos determine el idioma del documento.
Aplicar glosarios personalizados Traducir un documento mediante un glosario personalizado.

Formatos de documento admitidos por la traducción asincrónica

Tipo de archivo Extensión de archivo Tipo de contenido Descripción
Texto sin formato .txt text/plain Documento de texto sin formato
Valores separados por tabulaciones .txv
.tab
text/tab-separated-values Formato de archivo de texto que usa tabulaciones para separar los valores y nuevas líneas para separar los registros.
Valores separados por comas .csv text/csv Formato de archivo de texto que usa comas como delimitador entre valores.
Lenguaje de marcado de hipertexto .html
.htm
text/html HTML es un lenguaje de marcado estándar que se usa para estructurar contenido y páginas web.
MHTML .mhtml
.mht
message/rfc822
@application/x-mimearchive
@multipart/related
Formato de archivo de página web.
Microsoft PowerPoint .pptx application/vnd.openxmlformats-officedocument.presentationml.presentation Formato de archivo basado en XML que se usa para presentaciones de diapositivas de PowerPoint.
Microsoft Excel .xlsx application/vnd.openxmlformats-officedocument.spreadsheetml.sheet Formato de archivo basado en XML que se usa para hojas de cálculo de Excel.
Microsoft Word .docx application/vnd.openxmlformats-officedocument.wordprocessingml.document Formato de archivo basado en XML que se usa para documentos de Word.
Microsoft Outlook .msg application/vnd.ms-outlook Formato de archivo que se usa para objetos de mensaje de correo almacenados de Outlook.
Intercambio de localización XML .xlf
.xliff
application/xliff+xml Formato de archivo estándar basado en XML ampliamente utilizado en el procesamiento de software de traducción y localización.

Formatos de glosario admitidos por la traducción sincrónica

La traducción de documentos admite los siguientes tipos de archivo de glosario:

Tipo de archivo Extensión de archivo Descripción
Valores separados por comas csv Archivo de datos sin formato delimitados por comas que usan los programas de hoja de cálculo.
XmlLocalizationInterchange xlf , xliff Formato basado en XML y diseñado para estandarizar cómo se pasan los datos durante el proceso de localización.
TabSeparatedValues tsv, tab Archivo de datos sin formato delimitado por tabulaciones que usan los programas de hoja de cálculo.

Límites de solicitud de traducción de documentos

Para obtener información detallada sobre los límites de solicitudes de Azure Translator, consulteLímites de solicitudes de traducción de documentos.

Residencia de datos de traducción de documentos

La residencia de datos de traducción de documentos depende de la región de Azure donde se creó el recurso translator:

✔️ Característica: Traducción de documentos
✔️ Punto de conexión del servicio: personalizado: <name-of-your-resource.cognitiveservices.azure.com/translator/text/batch/v1.1

Región creada por el recurso Solicitud del centro de datos de procesamiento
Global Centro de datos más cercano disponible.
América Este de EE. UU. 2 • Oeste de EE. UU. 2
Asia Pacífico Este de Japón • Sudeste asiático
Europa (excepto Suiza) Centro de Francia • Oeste de Europa
Suiza Norte de Suiza • Oeste de Suiza

Pasos siguientes

En nuestro inicio rápido, aprenderá a empezar a usar rápidamente la traducción de documentos. Para empezar, necesitará una cuenta de Azure activa. En caso de no tener ninguna, puede crear una gratis.