Problemas conhecidos - Microsoft Foundry

Este artigo lista problemas conhecidos e soluções alternativas para o Foundry. Examine esses problemas antes de enviar uma solicitação de suporte.

Serviço de Agente

Sem problemas ativos conhecidos atualmente.

Ferramentas de Fundição

Azure Speech nas ferramentas Foundry

As tabelas a seguir descrevem os problemas conhecidos atuais para Fala, incluindo STT (Conversão de Fala em Texto), TTS (Conversão de Texto em Fala) e SDK de Fala/Runtime.

Problemas ativos conhecidos de STT (Conversão de Fala em Texto)

A tabela a seguir lista os problemas conhecidos atuais de Conversão de Fala em Texto:

ID do problema Categoria Título Descrição Solução alternativa Data de publicação do problema
1001 Conteúdo Transcrições de STT com unidades em libra A transcrição em tempo real frequentemente converte "libras" para "lb" incorretamente quando as frases são ditas em um dialeto britânico, independentemente da configuração do idioma. Use o DPP (Processamento de Postagem de Exibição Personalizada) para treinar um modelo de fala personalizado para corrigir resultados padrão do DPP (por exemplo, Libras {tab} Libras). Para obter mais informações, consulte Como preparar dados de treinamento de formato de texto de exibição para fala personalizada. 9 de junho de 2025
1002 Conteúdo Transcrições de STT com direções cardeais O modelo de reconhecimento de fala 20241218 pode interpretar incorretamente entradas de áudio que incluem direções cardinais. Por exemplo, "SW123456" pode ser transcrito como "Southwest 123456". Erros semelhantes podem ocorrer com outras direções cardeais. Use a formatação de Exibição Personalizada para mapear "Sudoeste" para "SO" em uma regra de reescrita. Para obter mais informações, consulte Como preparar dados de treinamento de formato de texto de exibição para fala personalizada. 9 de junho de 2025
1003 Modelo As transcrições STT podem incluir etiquetas internas inesperadas do sistema Marcas inesperadas como "nsnoise" aparecem nos resultados da transcrição. Este problema foi relatado inicialmente para o modelo árabe (ar-SA), mas também ocorre em modelos em inglês (en-US e en-GB). Uma futura atualização do modelo adiciona um filtro para remover o "nsnoise" dos dados de treinamento. Nenhuma solução alternativa está disponível. Uma correção é planejada em uma atualização de modelo futura. 9 de junho de 2025
1004 Modelo Transcrições STT com ortografias imprecisas de nomes e palavras específicas do idioma. Transcrição imprecisa de nomes específicos do idioma devido à falta de cobertura de entidades no modelo base para locais de nível 2. Esse problema ocorre quando os modelos base não encontraram uma palavra específica antes. Treine modelos de Fala Personalizada para incluir nomes e palavras desconhecidos como dados de treinamento. Você também pode adicionar palavras desconhecidas como uma lista de frases em runtime para melhorar a precisão do reconhecimento. 9 de junho de 2025
1005 Tipos de arquivo Palavras sem contexto ocasionalmente adicionadas na saída em tempo real do STT Arquivos de áudio que consistem exclusivamente em ruído de plano de fundo podem resultar em transcrições imprecisas. O ideal é que apenas frases faladas sejam transcritas, mas isso não está ocorrendo com o modelo nl-NL. Use o Microsoft Audio Stack (MAS) integrado ao SDK de Fala para supressão de ruído e cancelamento de eco. Essa otimização ajuda a melhorar a qualidade do áudio antes de chegar ao serviço STT. 9 de junho de 2025
1006 Tipos de arquivo Falha de decodificação MP4 devido à posição de 'moov atom' A decodificação de arquivos de contêiner MP4 pode falhar porque o "átomo moov" está localizado no final do arquivo em vez do início. Essa estrutura torna o arquivo não transmissível para o serviço atual, especialmente para arquivos maiores que 10 MB. Pré-processar o arquivo usando utilitários de codec de áudio para mover o "moov atom" para o início ou converter o arquivo em MP3. 8 de agosto de 2025

Problemas conhecidos ativos de TTS (Conversão de Texto em Fala)

A tabela a seguir lista os problemas conhecidos atuais para Conversão de Texto em Fala:

ID do problema Categoria Título Descrição Solução alternativa Data de publicação do problema
2001 Serviço Cópia de modelo por meio da API REST O serviço TTS não permite a cópia de modelo por meio da API REST para fins de recuperação de desastre. Nenhuma solução alternativa está disponível. Essa é uma limitação atual. 9 de junho de 2025
2002 Avatar do TTS Parâmetros ausentes Parâmetros de avatar do TTS avatarPosition e avatarSize não são compatíveis na síntese em lote. Nenhuma solução alternativa está disponível. Essa é uma limitação atual. 9 de junho de 2025
2003 Avatar do TTS Nomes de arquivo de blob ausentes O URL outputs: result da tarefa de síntese de avatar em lote não inclui o nome do arquivo de blob. Use subtitleType = soft_embedded como uma solução alternativa temporária. 9 de junho de 2025
2004 Avatar do TTS Síntese em lote não é suportada para avatar de TTS A síntese em lote para avatar não suporta Bring Your Own Storage (BYOS) e requer que a conta de armazenamento permita o tráfego externo. Nenhuma solução alternativa está disponível. Essa é uma limitação atual. 9 de junho de 2025
2005 Serviço Atualização de cache DNS após a migração de julho de 2025 Os clusters de TTS de Fala herdados na Ásia foram removidos em 31 de julho de 2025 por motivos de conformidade. Todo o tráfego migrado para novos IPs. Alguns clientes ainda podem enfrentar problemas devido a caches DNS locais ou secundários persistentes que não foram atualizados. Desmarque os caches DNS locais e secundários para resolver problemas de conectividade com os novos IPs de cluster TTS. 24 de julho de 2025
2006 TTS Duplicação de limite de palavras na saída Azure TTS às vezes retorna entradas de limite de palavra duplicadas na saída de síntese, especialmente ao usar determinadas configurações SSML. Essa duplicação pode levar a dados de tempo imprecisos e desalinhamento em aplicativos downstream. Pós-processar a saída para filtrar limites duplicados de palavras com base no carimbo de data/hora e no conteúdo da palavra. 8 de agosto de 2025
2007 TTS Palavras parcialmente geradas em vozes árabes As saídas de voz árabe contêm palavras parcialmente geradas em casos de pronúncia não clara ou incompleta, especialmente para palavras que terminam com ة ou ت. Esse problema é reproduzível em várias vozes. Para atenuar esse problema, considere reformular o texto de saída de voz. 16 de setembro de 2025

Problemas conhecidos ativos do SDK/Runtime de reconhecimento de fala

A tabela a seguir lista os problemas conhecidos atuais do SDK de Fala/Runtime:

ID do problema Categoria Título Descrição Solução alternativa Data de publicação do problema
3001 SDK/Runtime O parâmetro InitialSilenceTimeout causa 400 erros A configuração InitialSilenceTimeout como 0 causa 400 erros. O endSilenceTimeout parâmetro também pode levar a transcrições incorretas – quando definido como um valor diferente de 0, o sistema desconsidera a entrada do usuário após a duração especificada. Defina InitialSilenceTimeoutMs como 0 usando SpeechConfig.fromSubscription(subscriptionKey, region) para desabilitar o tempo limite devido ao silêncio inicial. Para o reconhecimento de tiro único, a sessão termina após 30 segundos de silêncio inicial. Para reconhecimento contínuo, o serviço relata uma frase vazia após 30 segundos e continua. O Speech_SegmentationMaximumTimeMs parâmetro determina o comprimento máximo da frase (padrão: 30.000 ms). 9 de junho de 2025
3002 SDK/Runtime O parâmetro SegmentationTimeout causa palavras falsas Palavras aleatórias aparecem nos resultados do reconhecimento de fala quando SegmentationSilenceTimeout é definido para superior a 1.000 milissegundos. Mantenha o valor padrão SegmentationTimeout de 650 ms. 9 de junho de 2025
3003 SDK/Runtime Duração do locutor ausente durante a diarização em tempo real no STT O SDK Python não exibe a duração da fala ao usar a diarização em tempo real com STT. Verifique o deslocamento e a duração no resultado seguindo a documentação da classe de resultados da transcrição da conversa. 9 de junho de 2025
3004 Avatar do SDK/TTS Desconexões frequentes com o SDK do JavaScript O avatar TTS não carrega ou desconecta e reconecta frequentemente ao usar um avatar personalizado com o SDK JavaScript. Abra a porta UDP 3478. 9 de junho de 2025

Tradutor do Azure em Ferramentas de Foundry

As tabelas a seguir descrevem os problemas conhecidos atuais do Tradutor.

Problemas conhecidos ativos da Tradução de Texto

ID do problema Categoria Título Descrição Solução alternativa Data de publicação do problema
4001 Modelo Preservando contexto e pronomes Alguns modelos de tradução não lidam bem com pronomes, especialmente pronomes de terceira pessoa. Esse problema ocorre porque o treinamento e a inferência no nível da sentença não preservam o contexto. A equipe do produto está trabalhando ativamente para transferir todos os modelos para treinamento e inferência no nível do documento. Nenhuma solução alternativa direta está disponível. Examine e ajuste manualmente o uso do pronome conforme necessário. 5 de fevereiro de 2025
4002 Conteúdo Tradução de frases com texto em linguagem mista A API de Tradução de Texto não dá suporte à tradução de frases que contêm entrada em idioma misto. As traduções podem estar incorretas ou incompletas quando uma única frase inclui vários idiomas. Especifique o idioma de origem pretendido, remova a frase de idioma misto ou divida o texto em segmentos de linguagem única. 5 de fevereiro de 2025

Problemas ativos conhecidos da Tradução de Documentos

ID do problema Categoria Título Descrição Solução alternativa Data de publicação do problema
5001 Formatação Formatação de expressões matemáticas Documentos traduzidos podem não manter totalmente a formatação de expressões matemáticas. Números sobrescritos e subscritos podem ser reformatados incorretamente. Nenhuma solução alternativa direta está disponível. Ajuste manualmente a formatação de expressões matemáticas conforme necessário. 5 de fevereiro de 2025
5002 Conteúdo Traduzir documentos com idiomas de origem mistos A tradução de documentos pode não traduzir documentos de origem com vários idiomas, levando a resultados incorretos ou incompletos. Especifique o idioma de origem pretendido. Como alternativa, remova a frase em idioma misto ou divida o texto em segmentos que contêm apenas um idioma. 5 de fevereiro de 2025
5003 Tipos de arquivo Traduzindo documentos complexos Documentos com milhares de páginas complexas podem encontrar falhas durante os processos de extração, tradução e remontagem. Esses documentos geralmente incluem imagens, texto inserido em imagens e texto digitado manualmente. Divida o documento grande em seções menores (por exemplo, divida um arquivo de 1.000 páginas em aproximadamente 10 arquivos de 100 páginas cada) e envie-os individualmente. 5 de fevereiro de 2025
5004 Formatação Traduzir documentos que contêm tabelas e gráficos sem bordas Gráficos e tabelas com texto horizontal e vertical misto, tamanhos de células variáveis ou estruturas de grade sem borda são difíceis de formatar com precisão durante a tradução. Recrie documentos usando tabelas e gráficos bordados em vez dos sem bordas para melhorar a qualidade da saída da tradução. 1º de abril de 2025
5005 Conteúdo Traduzindo documentos que contêm marcas d'água visíveis ou selos Marcas d'água visíveis ou selos podem se sobrepor ao texto, dificultando que os modelos reconheçam e processem o conteúdo com precisão. Os documentos podem permanecer não traduzidos ou apenas parcialmente traduzidos. Use documentos limpos e sem marca d'água para obter resultados ideais de tradução. 21 de maio de 2025

Azure Machine Learning

Para problemas conhecidos relacionados a Azure Machine Learning, consulte Azure Machine Learning problemas conhecidos.