Problemas conocidos: Microsoft Foundry

En este artículo se enumeran los problemas conocidos y las soluciones alternativas para Foundry. Revise estos problemas antes de enviar una solicitud de soporte técnico.

  • Compruebe la página de estado Azure en busca de interrupciones de nivel de servicio.
  • Configure las notificaciones de interrupción en el portal Azure Service Health.

Servicio del agente

Actualmente no hay problemas conocidos activos.

Herramientas de fundición

Azure Speech en Foundry Tools

En las siguientes tablas se describen los problemas conocidos actuales de voz, incluidos Voz a texto (STT), Texto a voz (TTS) y Speech SDK/Runtime.

Problemas activos conocidos de conversión de voz a texto (STT)

En la tabla siguiente se enumeran los problemas conocidos actuales de Voz en texto:

Identificador del problema Categoría Título Descripción Solución alternativa Fecha de publicación de la edición
1001 Contenido Transcripciones de STT con unidades de libras La transcripción en tiempo real a menudo convierte incorrectamente "libras" a "lbs" cuando las frases se pronuncian en un dialecto del Reino Unido, sin importar la configuración del idioma. Use el postprocesamiento de visualización personalizado (DPP) para entrenar un modelo de voz personalizado para corregir los resultados predeterminados de DPP (por ejemplo, libras {pestaña} libras). Para obtener más información, consulte Preparación de los datos de entrenamiento de formato de texto para la visualización de voz personalizada. 9 de junio de 2025
1002 Contenido Transcripciones de STT con direcciones cardinales El modelo de reconocimiento de voz 20241218 podría interpretar inexactamente las entradas de audio que incluyen direcciones cardinales. Por ejemplo, "SW123456" podría transcribirse como "Southwest 123456". Pueden producirse errores similares con otras direcciones cardinales. Use el formato de visualización personalizado para asignar "Suroeste" a "SW" en una regla de reescritura. Para obtener más información, consulte Preparación de los datos de entrenamiento de formato de texto para la visualización de voz personalizada. 9 de junio de 2025
1003 Modelo Las transcripciones de STT pueden incluir etiquetas de sistema internas inesperadas Las etiquetas inesperadas como "nsnoise" aparecen en los resultados de la transcripción. Este problema se informó inicialmente para el modelo árabe (ar-SA), pero también se produce en los modelos en inglés (en-US y en-GB). Una actualización futura del modelo agrega un filtro para eliminar el "nsnoise" de los datos de entrenamiento. No hay ninguna solución alternativa disponible. Se planea una corrección en una actualización futura del modelo. 9 de junio de 2025
1004 Modelo Transcripciones de STT con ortografías inexactas de nombres y palabras específicos del lenguaje Transcripción inexacta de nombres específicos del idioma por falta de cobertura de entidades en el modelo base para configuraciones regionales de nivel 2. Este problema se produce cuando los modelos base no han encontrado una palabra específica antes. Entrene modelos de Custom Speech para incluir nombres y palabras desconocidos como datos de entrenamiento. También puede agregar palabras desconocidas como una lista de frases en tiempo de ejecución para mejorar la precisión del reconocimiento. 9 de junio de 2025
1005 Tipos de archivo Ocasionalmente se añaden palabras fuera de contexto en la salida en tiempo real de STT. Los archivos de audio que constan únicamente de ruido de fondo pueden dar lugar a transcripciones inexactas. Idealmente, solo se deben transcribir las oraciones habladas, pero esto no ocurre con el modelo de nl-NL. Use el Microsoft Audio Stack (MAS) integrado en el SDK de Voz para la supresión de ruido y la cancelación de eco. Esta optimización ayuda a mejorar la calidad del audio antes de alcanzar el servicio STT. 9 de junio de 2025
1006 Tipos de archivo Error de descodificación de MP4 debido a la posición del "moov atom" Es posible que se produzca un error en la descodificación de archivos de contenedor MP4 porque el "moov atom" se encuentra al final del archivo en lugar del principio. Esta estructura hace que el archivo sea instreamable para el servicio actual, especialmente para los archivos de más de 10 MB. Preprocese el archivo utilizando herramientas de codificación de audio para mover el "moov atom" al principio o convertir el archivo a MP3. 8 de agosto de 2025

problemas conocidos activos de Texto a voz (TTS)

En la tabla siguiente se enumeran los problemas conocidos actuales de Texto a voz:

Identificador del problema Categoría Título Descripción Solución alternativa Fecha de publicación de la edición
2001 Servicio Copia de modelos a través de la API REST El servicio TTS no permite la copia de modelos a través de la API REST con fines de recuperación ante desastres. No hay ninguna solución alternativa disponible. Se trata de una limitación actual. 9 de junio de 2025
2002 Avatar de TTS Parámetros que faltan Los parámetros avatarPosition del avatar de TTS y avatarSize no se admiten en la síntesis de Batch. No hay ninguna solución alternativa disponible. Se trata de una limitación actual. 9 de junio de 2025
2003 Avatar de TTS Faltan nombres de archivo de blobs La dirección URL outputs: result del trabajo de síntesis de avatares de Batch no incluye el nombre del archivo de blob. Use subtitleType = soft_embedded como solución temporal. 9 de junio de 2025
2004 Avatar de TTS Síntesis por lotes no admitida para el avatar de TTS La síntesis de Batch para avatares no admite la función "bring-your-own-storage (BYOS)" y requiere la cuenta de almacenamiento para permitir el tráfico externo. No hay ninguna solución alternativa disponible. Se trata de una limitación actual. 9 de junio de 2025
2005 Servicio Actualización de caché DNS después de la migración de julio de 2025 Los antiguos clústeres de síntesis de texto a voz en Asia se retiraron el 31 de julio de 2025 para cumplir con la normativa vigente. Todo el tráfico migrado a direcciones IP nuevas. Es posible que algunos clientes sigan experimentando problemas debido a cachés DNS locales o secundarias persistentes que no se han actualizado. Borre las cachés DNS locales y secundarias para resolver problemas de conectividad con las nuevas direcciones IP del clúster de TTS. 24 de julio de 2025
2006 TTS Duplicación de límites de palabras en la salida Azure TTS a veces devuelve entradas de límite de palabra duplicadas en la salida de síntesis, especialmente cuando se usan determinadas configuraciones SSML. Esta duplicación puede dar lugar a datos de tiempo inexactos y desalineación en las aplicaciones posteriores. Postprocese la salida para filtrar los límites de palabras duplicadas basándose en la marca de tiempo y el contenido de la palabra. 8 de agosto de 2025
2007 TTS Palabras parcialmente generadas en voces árabes Las salidas de voz árabe contienen palabras parcialmente generadas en casos de pronunciación poco clara o incompleta, especialmente para las palabras que terminan con ت o ت. Este problema es reproducible en varias voces. Para mitigar este problema, considere la posibilidad de volver a compilar el texto de salida de voz. 16 de septiembre de 2025

Problemas conocidos activos del SDK o del entorno de ejecución de Voz

En la tabla siguiente se enumeran los problemas conocidos actuales de Speech SDK/Runtime:

Identificador del problema Categoría Título Descripción Solución alternativa Fecha de publicación de la edición
3001 SDK/Runtime El parámetro InitialSilenceTimeout produce 400 errores Si se establece InitialSilenceTimeout en 0, se producen 400 errores. El endSilenceTimeout parámetro también puede provocar transcripciones incorrectas, cuando se establece en un valor distinto de 0, el sistema ignora la entrada del usuario después de la duración especificada. Establezca InitialSilenceTimeoutMs en 0 mediante SpeechConfig.fromSubscription(subscriptionKey, region) para deshabilitar el tiempo de espera debido al silencio inicial. Para el reconocimiento de una sola toma, la sesión finaliza después de 30 segundos de silencio inicial. Para el reconocimiento continuo, el servicio notifica una frase vacía después de 30 segundos y continúa. El Speech_SegmentationMaximumTimeMs parámetro determina la longitud máxima de la frase (valor predeterminado: 30 000 ms). 9 de junio de 2025
3002 SDK/Runtime El parámetro SegmentationTimeout provoca palabras falsas Las palabras aleatorias aparecen en los resultados del reconocimiento de voz cuando SegmentationSilenceTimeout se establece en más de 1000 ms. Mantenga el valor predeterminado SegmentationTimeout de 650 ms. 9 de junio de 2025
3003 SDK/Runtime Falta la duración del orador durante la diarización en tiempo real en STT El SDK de Python no muestra el tiempo total que habla el interlocutor al usar la diarización en tiempo real con la conversión de voz a texto. Compruebe el desfase y la duración en el resultado siguiendo la documentación de la clase de resultado de transcripción de conversaciones. 9 de junio de 2025
3004 Avatar de SDK/TTS Desconexiones frecuentes con el SDK de JavaScript El avatar de TTS no se carga o se desconecta con frecuencia y se vuelve a conectar cuando se usa un avatar personalizado con el SDK de JavaScript. Abra el puerto UDP 3478. 9 de junio de 2025

Azure Translator en Foundry Tools

En las tablas siguientes se describen los problemas conocidos actuales de Translator.

Problemas activos conocidos de la traducción de texto

Identificador del problema Categoría Título Descripción Solución alternativa Fecha de publicación de la edición
4001 Modelo Conservación del contexto y los pronombres Algunos modelos de traducción no controlan bien los pronombres, especialmente los pronombres de tercera persona. Este problema se produce porque el entrenamiento y la inferencia de nivel de frase no conservan el contexto. El equipo de producto está trabajando activamente para transferir todos los modelos al entrenamiento e inferencia a nivel documental. No hay ninguna solución alternativa directa disponible. Revise y ajuste manualmente el uso de pronombre según sea necesario. 5 de febrero de 2025
4002 Contenido Traducción de oraciones con texto de idioma mixto Text Translation API no admite la traducción de oraciones que contienen entrada de lenguaje mixto. Las traducciones pueden ser incorrectas o incompletas cuando una sola oración incluye varios idiomas. Especifique el idioma de origen previsto, quite la oración de idioma mixto o divida el texto en segmentos de un solo idioma. 5 de febrero de 2025

Problemas activos conocidos de traducción de documentos

Identificador del problema Categoría Título Descripción Solución alternativa Fecha de publicación de la edición
5001 Formato Formato de expresiones matemáticas Es posible que los documentos traducidos no conserven completamente el formato de las expresiones matemáticas. A los números en superíndice y subíndice se les puede haber aplicado nuevamente un formato incorrecto. No hay ninguna solución alternativa directa disponible. Ajuste manualmente el formato de las expresiones matemáticas según sea necesario. 5 de febrero de 2025
5002 Contenido Traducción de documentos con idiomas de origen mixto Es posible que la traducción de documentos no traduzca documentos de origen con varios idiomas, lo que provoca resultados incorrectos o incompletos. Especifique el idioma de origen previsto. Como alternativa, quite la oración de idioma mixto o divida el texto en segmentos que contengan solo un idioma. 5 de febrero de 2025
5003 Tipos de archivo Traducción de documentos complejos Los documentos con miles de páginas complejas pueden encontrar errores durante los procesos de extracción, traducción y reensamblaje. Estos documentos suelen incluir imágenes, texto insertado dentro de imágenes y texto escrito manualmente. Divida el documento grande en secciones más pequeñas (por ejemplo, divida un archivo de 1000 páginas en aproximadamente 10 archivos de 100 páginas cada uno) y envíelos individualmente. 5 de febrero de 2025
5004 Formato Traducción de documentos que contienen gráficos y tablas sin borde Los gráficos y tablas con texto horizontal y vertical mixto, diferentes tamaños de celda o estructuras de cuadrícula sin borde son difíciles de dar formato con precisión durante la traducción. Vuelva a crear documentos utilizando tablas y gráficos con bordes en lugar de sin bordes para mejorar la calidad del resultado de la traducción. 1 de abril de 2025
5005 Contenido Traducción de documentos que contienen marcas de agua visibles o sellos Las marcas de agua o sellos visibles se pueden superponer con texto, lo que dificulta que los modelos reconozcan y procesen con precisión el contenido. Los documentos pueden permanecer sin traducir o solo parcialmente traducidos. Use documentos limpios y libres de marcas de agua para obtener resultados óptimos de traducción. 21 de mayo de 2025

Azure Machine Learning

Para ver los problemas conocidos relacionados con Azure Machine Learning, consulte Azure Machine Learning problemas conocidos.