Problemas conocidos: Microsoft Foundry

En este artículo se enumeran los problemas conocidos y las soluciones alternativas para Foundry. Revise estos problemas antes de enviar una solicitud de soporte técnico.

Compruebe la página de estado Azure en busca de interrupciones de nivel de servicio.
Configure las notificaciones de interrupción en el portal Azure Service Health.

Servicio del agente

Actualmente no hay problemas conocidos activos.

Herramientas de fundición

Azure Speech en Foundry Tools

En las siguientes tablas se describen los problemas conocidos actuales de voz, incluidos Voz a texto (STT), Texto a voz (TTS) y Speech SDK/Runtime.

Problemas activos conocidos de conversión de voz a texto (STT)

En la tabla siguiente se enumeran los problemas conocidos actuales de Voz en texto:

Identificador del problema	Categoría	Título	Descripción	Solución alternativa	Fecha de publicación de la edición
1001	Contenido	Transcripciones de STT con unidades de libras	La transcripción en tiempo real a menudo convierte incorrectamente "libras" a "lbs" cuando las frases se pronuncian en un dialecto del Reino Unido, sin importar la configuración del idioma.	Use el postprocesamiento de visualización personalizado (DPP) para entrenar un modelo de voz personalizado para corregir los resultados predeterminados de DPP (por ejemplo, libras {pestaña} libras). Para obtener más información, consulte Preparación de los datos de entrenamiento de formato de texto para la visualización de voz personalizada.	9 de junio de 2025
1002	Contenido	Transcripciones de STT con direcciones cardinales	El modelo de reconocimiento de voz 20241218 podría interpretar inexactamente las entradas de audio que incluyen direcciones cardinales. Por ejemplo, "SW123456" podría transcribirse como "Southwest 123456". Pueden producirse errores similares con otras direcciones cardinales.	Use el formato de visualización personalizado para asignar "Suroeste" a "SW" en una regla de reescritura. Para obtener más información, consulte Preparación de los datos de entrenamiento de formato de texto para la visualización de voz personalizada.	9 de junio de 2025
1003	Modelo	Las transcripciones de STT pueden incluir etiquetas de sistema internas inesperadas	Las etiquetas inesperadas como "nsnoise" aparecen en los resultados de la transcripción. Este problema se informó inicialmente para el modelo árabe (ar-SA), pero también se produce en los modelos en inglés (en-US y en-GB). Una actualización futura del modelo agrega un filtro para eliminar el "nsnoise" de los datos de entrenamiento.	No hay ninguna solución alternativa disponible. Se planea una corrección en una actualización futura del modelo.	9 de junio de 2025
1004	Modelo	Transcripciones de STT con ortografías inexactas de nombres y palabras específicos del lenguaje	Transcripción inexacta de nombres específicos del idioma por falta de cobertura de entidades en el modelo base para configuraciones regionales de nivel 2. Este problema se produce cuando los modelos base no han encontrado una palabra específica antes.	Entrene modelos de Custom Speech para incluir nombres y palabras desconocidos como datos de entrenamiento. También puede agregar palabras desconocidas como una lista de frases en tiempo de ejecución para mejorar la precisión del reconocimiento.	9 de junio de 2025
1005	Tipos de archivo	Ocasionalmente se añaden palabras fuera de contexto en la salida en tiempo real de STT.	Los archivos de audio que constan únicamente de ruido de fondo pueden dar lugar a transcripciones inexactas. Idealmente, solo se deben transcribir las oraciones habladas, pero esto no ocurre con el modelo de nl-NL.	Use el Microsoft Audio Stack (MAS) integrado en el SDK de Voz para la supresión de ruido y la cancelación de eco. Esta optimización ayuda a mejorar la calidad del audio antes de alcanzar el servicio STT.	9 de junio de 2025
1006	Tipos de archivo	Error de descodificación de MP4 debido a la posición del "moov atom"	Es posible que se produzca un error en la descodificación de archivos de contenedor MP4 porque el "moov atom" se encuentra al final del archivo en lugar del principio. Esta estructura hace que el archivo sea instreamable para el servicio actual, especialmente para los archivos de más de 10 MB.	Preprocese el archivo utilizando herramientas de codificación de audio para mover el "moov atom" al principio o convertir el archivo a MP3.	8 de agosto de 2025

problemas conocidos activos de Texto a voz (TTS)

En la tabla siguiente se enumeran los problemas conocidos actuales de Texto a voz:

Identificador del problema	Categoría	Título	Descripción	Solución alternativa	Fecha de publicación de la edición
2001	Servicio	Copia de modelos a través de la API REST	El servicio TTS no permite la copia de modelos a través de la API REST con fines de recuperación ante desastres.	No hay ninguna solución alternativa disponible. Se trata de una limitación actual.	9 de junio de 2025
2002	Avatar de TTS	Parámetros que faltan	Los parámetros `avatarPosition` del avatar de TTS y `avatarSize` no se admiten en la síntesis de Batch.	No hay ninguna solución alternativa disponible. Se trata de una limitación actual.	9 de junio de 2025
2003	Avatar de TTS	Faltan nombres de archivo de blobs	La dirección URL `outputs: result` del trabajo de síntesis de avatares de Batch no incluye el nombre del archivo de blob.	Use `subtitleType = soft_embedded` como solución temporal.	9 de junio de 2025
2004	Avatar de TTS	Síntesis por lotes no admitida para el avatar de TTS	La síntesis de Batch para avatares no admite la función "bring-your-own-storage (BYOS)" y requiere la cuenta de almacenamiento para permitir el tráfico externo.	No hay ninguna solución alternativa disponible. Se trata de una limitación actual.	9 de junio de 2025
2005	Servicio	Actualización de caché DNS después de la migración de julio de 2025	Los antiguos clústeres de síntesis de texto a voz en Asia se retiraron el 31 de julio de 2025 para cumplir con la normativa vigente. Todo el tráfico migrado a direcciones IP nuevas. Es posible que algunos clientes sigan experimentando problemas debido a cachés DNS locales o secundarias persistentes que no se han actualizado.	Borre las cachés DNS locales y secundarias para resolver problemas de conectividad con las nuevas direcciones IP del clúster de TTS.	24 de julio de 2025
2006	TTS	Duplicación de límites de palabras en la salida	Azure TTS a veces devuelve entradas de límite de palabra duplicadas en la salida de síntesis, especialmente cuando se usan determinadas configuraciones SSML. Esta duplicación puede dar lugar a datos de tiempo inexactos y desalineación en las aplicaciones posteriores.	Postprocese la salida para filtrar los límites de palabras duplicadas basándose en la marca de tiempo y el contenido de la palabra.	8 de agosto de 2025
2007	TTS	Palabras parcialmente generadas en voces árabes	Las salidas de voz árabe contienen palabras parcialmente generadas en casos de pronunciación poco clara o incompleta, especialmente para las palabras que terminan con ت o ت. Este problema es reproducible en varias voces.	Para mitigar este problema, considere la posibilidad de volver a compilar el texto de salida de voz.	16 de septiembre de 2025

Problemas conocidos activos del SDK o del entorno de ejecución de Voz

En la tabla siguiente se enumeran los problemas conocidos actuales de Speech SDK/Runtime:

Identificador del problema	Categoría	Título	Descripción	Solución alternativa	Fecha de publicación de la edición
3001	SDK/Runtime	El parámetro InitialSilenceTimeout produce 400 errores	Si se establece `InitialSilenceTimeout` en 0, se producen 400 errores. El `endSilenceTimeout` parámetro también puede provocar transcripciones incorrectas, cuando se establece en un valor distinto de 0, el sistema ignora la entrada del usuario después de la duración especificada.	Establezca `InitialSilenceTimeoutMs` en 0 mediante `SpeechConfig.fromSubscription(subscriptionKey, region)` para deshabilitar el tiempo de espera debido al silencio inicial. Para el reconocimiento de una sola toma, la sesión finaliza después de 30 segundos de silencio inicial. Para el reconocimiento continuo, el servicio notifica una frase vacía después de 30 segundos y continúa. El `Speech_SegmentationMaximumTimeMs` parámetro determina la longitud máxima de la frase (valor predeterminado: 30 000 ms).	9 de junio de 2025
3002	SDK/Runtime	El parámetro SegmentationTimeout provoca palabras falsas	Las palabras aleatorias aparecen en los resultados del reconocimiento de voz cuando `SegmentationSilenceTimeout` se establece en más de 1000 ms.	Mantenga el valor predeterminado `SegmentationTimeout` de 650 ms.	9 de junio de 2025
3003	SDK/Runtime	Falta la duración del orador durante la diarización en tiempo real en STT	El SDK de Python no muestra el tiempo total que habla el interlocutor al usar la diarización en tiempo real con la conversión de voz a texto.	Compruebe el desfase y la duración en el resultado siguiendo la documentación de la clase de resultado de transcripción de conversaciones.	9 de junio de 2025
3004	Avatar de SDK/TTS	Desconexiones frecuentes con el SDK de JavaScript	El avatar de TTS no se carga o se desconecta con frecuencia y se vuelve a conectar cuando se usa un avatar personalizado con el SDK de JavaScript.	Abra el puerto UDP 3478.	9 de junio de 2025

Azure Translator en Foundry Tools

En las tablas siguientes se describen los problemas conocidos actuales de Translator.

Problemas activos conocidos de la traducción de texto

Identificador del problema	Categoría	Título	Descripción	Solución alternativa	Fecha de publicación de la edición
4001	Modelo	Conservación del contexto y los pronombres	Algunos modelos de traducción no controlan bien los pronombres, especialmente los pronombres de tercera persona. Este problema se produce porque el entrenamiento y la inferencia de nivel de frase no conservan el contexto. El equipo de producto está trabajando activamente para transferir todos los modelos al entrenamiento e inferencia a nivel documental.	No hay ninguna solución alternativa directa disponible. Revise y ajuste manualmente el uso de pronombre según sea necesario.	5 de febrero de 2025
4002	Contenido	Traducción de oraciones con texto de idioma mixto	Text Translation API no admite la traducción de oraciones que contienen entrada de lenguaje mixto. Las traducciones pueden ser incorrectas o incompletas cuando una sola oración incluye varios idiomas.	Especifique el idioma de origen previsto, quite la oración de idioma mixto o divida el texto en segmentos de un solo idioma.	5 de febrero de 2025

Problemas activos conocidos de traducción de documentos

Identificador del problema	Categoría	Título	Descripción	Solución alternativa	Fecha de publicación de la edición
5001	Formato	Formato de expresiones matemáticas	Es posible que los documentos traducidos no conserven completamente el formato de las expresiones matemáticas. A los números en superíndice y subíndice se les puede haber aplicado nuevamente un formato incorrecto.	No hay ninguna solución alternativa directa disponible. Ajuste manualmente el formato de las expresiones matemáticas según sea necesario.	5 de febrero de 2025
5002	Contenido	Traducción de documentos con idiomas de origen mixto	Es posible que la traducción de documentos no traduzca documentos de origen con varios idiomas, lo que provoca resultados incorrectos o incompletos.	Especifique el idioma de origen previsto. Como alternativa, quite la oración de idioma mixto o divida el texto en segmentos que contengan solo un idioma.	5 de febrero de 2025
5003	Tipos de archivo	Traducción de documentos complejos	Los documentos con miles de páginas complejas pueden encontrar errores durante los procesos de extracción, traducción y reensamblaje. Estos documentos suelen incluir imágenes, texto insertado dentro de imágenes y texto escrito manualmente.	Divida el documento grande en secciones más pequeñas (por ejemplo, divida un archivo de 1000 páginas en aproximadamente 10 archivos de 100 páginas cada uno) y envíelos individualmente.	5 de febrero de 2025
5004	Formato	Traducción de documentos que contienen gráficos y tablas sin borde	Los gráficos y tablas con texto horizontal y vertical mixto, diferentes tamaños de celda o estructuras de cuadrícula sin borde son difíciles de dar formato con precisión durante la traducción.	Vuelva a crear documentos utilizando tablas y gráficos con bordes en lugar de sin bordes para mejorar la calidad del resultado de la traducción.	1 de abril de 2025
5005	Contenido	Traducción de documentos que contienen marcas de agua visibles o sellos	Las marcas de agua o sellos visibles se pueden superponer con texto, lo que dificulta que los modelos reconozcan y procesen con precisión el contenido. Los documentos pueden permanecer sin traducir o solo parcialmente traducidos.	Use documentos limpios y libres de marcas de agua para obtener resultados óptimos de traducción.	21 de mayo de 2025

Azure Machine Learning

Para ver los problemas conocidos relacionados con Azure Machine Learning, consulte Azure Machine Learning problemas conocidos.

Portal de Azure Service Health
Visión general del estado de Azure

Comentarios

¿Le ha resultado útil esta página?

Last updated on 2026-05-06