Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
En este artículo se enumeran los problemas conocidos y las soluciones alternativas para Foundry. Revise estos problemas antes de enviar una solicitud de soporte técnico.
- Compruebe la página de estado Azure en busca de interrupciones de nivel de servicio.
- Configure las notificaciones de interrupción en el portal Azure Service Health.
Servicio del agente
Actualmente no hay problemas conocidos activos.
Herramientas de fundición
Azure Speech en Foundry Tools
En las siguientes tablas se describen los problemas conocidos actuales de voz, incluidos Voz a texto (STT), Texto a voz (TTS) y Speech SDK/Runtime.
Problemas activos conocidos de conversión de voz a texto (STT)
En la tabla siguiente se enumeran los problemas conocidos actuales de Voz en texto:
| Identificador del problema | Categoría | Título | Descripción | Solución alternativa | Fecha de publicación de la edición |
|---|---|---|---|---|---|
| 1001 | Contenido | Transcripciones de STT con unidades de libras | La transcripción en tiempo real a menudo convierte incorrectamente "libras" a "lbs" cuando las frases se pronuncian en un dialecto del Reino Unido, sin importar la configuración del idioma. | Use el postprocesamiento de visualización personalizado (DPP) para entrenar un modelo de voz personalizado para corregir los resultados predeterminados de DPP (por ejemplo, libras {pestaña} libras). Para obtener más información, consulte Preparación de los datos de entrenamiento de formato de texto para la visualización de voz personalizada. | 9 de junio de 2025 |
| 1002 | Contenido | Transcripciones de STT con direcciones cardinales | El modelo de reconocimiento de voz 20241218 podría interpretar inexactamente las entradas de audio que incluyen direcciones cardinales. Por ejemplo, "SW123456" podría transcribirse como "Southwest 123456". Pueden producirse errores similares con otras direcciones cardinales. | Use el formato de visualización personalizado para asignar "Suroeste" a "SW" en una regla de reescritura. Para obtener más información, consulte Preparación de los datos de entrenamiento de formato de texto para la visualización de voz personalizada. | 9 de junio de 2025 |
| 1003 | Modelo | Las transcripciones de STT pueden incluir etiquetas de sistema internas inesperadas | Las etiquetas inesperadas como "nsnoise" aparecen en los resultados de la transcripción. Este problema se informó inicialmente para el modelo árabe (ar-SA), pero también se produce en los modelos en inglés (en-US y en-GB). Una actualización futura del modelo agrega un filtro para eliminar el "nsnoise" de los datos de entrenamiento. | No hay ninguna solución alternativa disponible. Se planea una corrección en una actualización futura del modelo. | 9 de junio de 2025 |
| 1004 | Modelo | Transcripciones de STT con ortografías inexactas de nombres y palabras específicos del lenguaje | Transcripción inexacta de nombres específicos del idioma por falta de cobertura de entidades en el modelo base para configuraciones regionales de nivel 2. Este problema se produce cuando los modelos base no han encontrado una palabra específica antes. | Entrene modelos de Custom Speech para incluir nombres y palabras desconocidos como datos de entrenamiento. También puede agregar palabras desconocidas como una lista de frases en tiempo de ejecución para mejorar la precisión del reconocimiento. | 9 de junio de 2025 |
| 1005 | Tipos de archivo | Ocasionalmente se añaden palabras fuera de contexto en la salida en tiempo real de STT. | Los archivos de audio que constan únicamente de ruido de fondo pueden dar lugar a transcripciones inexactas. Idealmente, solo se deben transcribir las oraciones habladas, pero esto no ocurre con el modelo de nl-NL. | Use el Microsoft Audio Stack (MAS) integrado en el SDK de Voz para la supresión de ruido y la cancelación de eco. Esta optimización ayuda a mejorar la calidad del audio antes de alcanzar el servicio STT. | 9 de junio de 2025 |
| 1006 | Tipos de archivo | Error de descodificación de MP4 debido a la posición del "moov atom" | Es posible que se produzca un error en la descodificación de archivos de contenedor MP4 porque el "moov atom" se encuentra al final del archivo en lugar del principio. Esta estructura hace que el archivo sea instreamable para el servicio actual, especialmente para los archivos de más de 10 MB. | Preprocese el archivo utilizando herramientas de codificación de audio para mover el "moov atom" al principio o convertir el archivo a MP3. | 8 de agosto de 2025 |
problemas conocidos activos de Texto a voz (TTS)
En la tabla siguiente se enumeran los problemas conocidos actuales de Texto a voz:
| Identificador del problema | Categoría | Título | Descripción | Solución alternativa | Fecha de publicación de la edición |
|---|---|---|---|---|---|
| 2001 | Servicio | Copia de modelos a través de la API REST | El servicio TTS no permite la copia de modelos a través de la API REST con fines de recuperación ante desastres. | No hay ninguna solución alternativa disponible. Se trata de una limitación actual. | 9 de junio de 2025 |
| 2002 | Avatar de TTS | Parámetros que faltan | Los parámetros avatarPosition del avatar de TTS y avatarSize no se admiten en la síntesis de Batch. |
No hay ninguna solución alternativa disponible. Se trata de una limitación actual. | 9 de junio de 2025 |
| 2003 | Avatar de TTS | Faltan nombres de archivo de blobs | La dirección URL outputs: result del trabajo de síntesis de avatares de Batch no incluye el nombre del archivo de blob. |
Use subtitleType = soft_embedded como solución temporal. |
9 de junio de 2025 |
| 2004 | Avatar de TTS | Síntesis por lotes no admitida para el avatar de TTS | La síntesis de Batch para avatares no admite la función "bring-your-own-storage (BYOS)" y requiere la cuenta de almacenamiento para permitir el tráfico externo. | No hay ninguna solución alternativa disponible. Se trata de una limitación actual. | 9 de junio de 2025 |
| 2005 | Servicio | Actualización de caché DNS después de la migración de julio de 2025 | Los antiguos clústeres de síntesis de texto a voz en Asia se retiraron el 31 de julio de 2025 para cumplir con la normativa vigente. Todo el tráfico migrado a direcciones IP nuevas. Es posible que algunos clientes sigan experimentando problemas debido a cachés DNS locales o secundarias persistentes que no se han actualizado. | Borre las cachés DNS locales y secundarias para resolver problemas de conectividad con las nuevas direcciones IP del clúster de TTS. | 24 de julio de 2025 |
| 2006 | TTS | Duplicación de límites de palabras en la salida | Azure TTS a veces devuelve entradas de límite de palabra duplicadas en la salida de síntesis, especialmente cuando se usan determinadas configuraciones SSML. Esta duplicación puede dar lugar a datos de tiempo inexactos y desalineación en las aplicaciones posteriores. | Postprocese la salida para filtrar los límites de palabras duplicadas basándose en la marca de tiempo y el contenido de la palabra. | 8 de agosto de 2025 |
| 2007 | TTS | Palabras parcialmente generadas en voces árabes | Las salidas de voz árabe contienen palabras parcialmente generadas en casos de pronunciación poco clara o incompleta, especialmente para las palabras que terminan con ت o ت. Este problema es reproducible en varias voces. | Para mitigar este problema, considere la posibilidad de volver a compilar el texto de salida de voz. | 16 de septiembre de 2025 |
Problemas conocidos activos del SDK o del entorno de ejecución de Voz
En la tabla siguiente se enumeran los problemas conocidos actuales de Speech SDK/Runtime:
| Identificador del problema | Categoría | Título | Descripción | Solución alternativa | Fecha de publicación de la edición |
|---|---|---|---|---|---|
| 3001 | SDK/Runtime | El parámetro InitialSilenceTimeout produce 400 errores | Si se establece InitialSilenceTimeout en 0, se producen 400 errores. El endSilenceTimeout parámetro también puede provocar transcripciones incorrectas, cuando se establece en un valor distinto de 0, el sistema ignora la entrada del usuario después de la duración especificada. |
Establezca InitialSilenceTimeoutMs en 0 mediante SpeechConfig.fromSubscription(subscriptionKey, region) para deshabilitar el tiempo de espera debido al silencio inicial. Para el reconocimiento de una sola toma, la sesión finaliza después de 30 segundos de silencio inicial. Para el reconocimiento continuo, el servicio notifica una frase vacía después de 30 segundos y continúa. El Speech_SegmentationMaximumTimeMs parámetro determina la longitud máxima de la frase (valor predeterminado: 30 000 ms). |
9 de junio de 2025 |
| 3002 | SDK/Runtime | El parámetro SegmentationTimeout provoca palabras falsas | Las palabras aleatorias aparecen en los resultados del reconocimiento de voz cuando SegmentationSilenceTimeout se establece en más de 1000 ms. |
Mantenga el valor predeterminado SegmentationTimeout de 650 ms. |
9 de junio de 2025 |
| 3003 | SDK/Runtime | Falta la duración del orador durante la diarización en tiempo real en STT | El SDK de Python no muestra el tiempo total que habla el interlocutor al usar la diarización en tiempo real con la conversión de voz a texto. | Compruebe el desfase y la duración en el resultado siguiendo la documentación de la clase de resultado de transcripción de conversaciones. | 9 de junio de 2025 |
| 3004 | Avatar de SDK/TTS | Desconexiones frecuentes con el SDK de JavaScript | El avatar de TTS no se carga o se desconecta con frecuencia y se vuelve a conectar cuando se usa un avatar personalizado con el SDK de JavaScript. | Abra el puerto UDP 3478. | 9 de junio de 2025 |
Azure Translator en Foundry Tools
En las tablas siguientes se describen los problemas conocidos actuales de Translator.
Problemas activos conocidos de la traducción de texto
| Identificador del problema | Categoría | Título | Descripción | Solución alternativa | Fecha de publicación de la edición |
|---|---|---|---|---|---|
| 4001 | Modelo | Conservación del contexto y los pronombres | Algunos modelos de traducción no controlan bien los pronombres, especialmente los pronombres de tercera persona. Este problema se produce porque el entrenamiento y la inferencia de nivel de frase no conservan el contexto. El equipo de producto está trabajando activamente para transferir todos los modelos al entrenamiento e inferencia a nivel documental. | No hay ninguna solución alternativa directa disponible. Revise y ajuste manualmente el uso de pronombre según sea necesario. | 5 de febrero de 2025 |
| 4002 | Contenido | Traducción de oraciones con texto de idioma mixto | Text Translation API no admite la traducción de oraciones que contienen entrada de lenguaje mixto. Las traducciones pueden ser incorrectas o incompletas cuando una sola oración incluye varios idiomas. | Especifique el idioma de origen previsto, quite la oración de idioma mixto o divida el texto en segmentos de un solo idioma. | 5 de febrero de 2025 |
Problemas activos conocidos de traducción de documentos
| Identificador del problema | Categoría | Título | Descripción | Solución alternativa | Fecha de publicación de la edición |
|---|---|---|---|---|---|
| 5001 | Formato | Formato de expresiones matemáticas | Es posible que los documentos traducidos no conserven completamente el formato de las expresiones matemáticas. A los números en superíndice y subíndice se les puede haber aplicado nuevamente un formato incorrecto. | No hay ninguna solución alternativa directa disponible. Ajuste manualmente el formato de las expresiones matemáticas según sea necesario. | 5 de febrero de 2025 |
| 5002 | Contenido | Traducción de documentos con idiomas de origen mixto | Es posible que la traducción de documentos no traduzca documentos de origen con varios idiomas, lo que provoca resultados incorrectos o incompletos. | Especifique el idioma de origen previsto. Como alternativa, quite la oración de idioma mixto o divida el texto en segmentos que contengan solo un idioma. | 5 de febrero de 2025 |
| 5003 | Tipos de archivo | Traducción de documentos complejos | Los documentos con miles de páginas complejas pueden encontrar errores durante los procesos de extracción, traducción y reensamblaje. Estos documentos suelen incluir imágenes, texto insertado dentro de imágenes y texto escrito manualmente. | Divida el documento grande en secciones más pequeñas (por ejemplo, divida un archivo de 1000 páginas en aproximadamente 10 archivos de 100 páginas cada uno) y envíelos individualmente. | 5 de febrero de 2025 |
| 5004 | Formato | Traducción de documentos que contienen gráficos y tablas sin borde | Los gráficos y tablas con texto horizontal y vertical mixto, diferentes tamaños de celda o estructuras de cuadrícula sin borde son difíciles de dar formato con precisión durante la traducción. | Vuelva a crear documentos utilizando tablas y gráficos con bordes en lugar de sin bordes para mejorar la calidad del resultado de la traducción. | 1 de abril de 2025 |
| 5005 | Contenido | Traducción de documentos que contienen marcas de agua visibles o sellos | Las marcas de agua o sellos visibles se pueden superponer con texto, lo que dificulta que los modelos reconozcan y procesen con precisión el contenido. Los documentos pueden permanecer sin traducir o solo parcialmente traducidos. | Use documentos limpios y libres de marcas de agua para obtener resultados óptimos de traducción. | 21 de mayo de 2025 |
Azure Machine Learning
Para ver los problemas conocidos relacionados con Azure Machine Learning, consulte Azure Machine Learning problemas conocidos.
Contenido relacionado
- Portal de Azure Service Health
- Visión general del estado de Azure