已知問題 - Microsoft Foundry

本文列出了 Foundry 已知的問題與解決方法。 在提交支援請求前,請先檢視這些問題。

代理服務

目前沒有已知的活躍問題。

鑄造工具

Azure 語音在鑄造工具中的應用

以下表格描述目前已知的語音問題,包括語音轉文字(STT)、文字轉語音(TTS)及語音 SDK/執行時。

STT 語音轉文字目前已知問題

下表列出目前已知的語音轉文字問題:

發行號識別碼 分類 標題 描述 解決方法 發佈日期
1001 內容 STT 轉錄(以磅單位為單位) 即時轉錄通常會在使用英國口音時,無論語言設定為何,將「pounds」錯誤轉換為「lbs」。 使用自訂顯示後處理 (DPP) 訓練自訂語音模型,以修正預設 DPP 結果 (例如,Pounds {tab} Pounds)。 欲了解更多資訊,請參閱 「如何準備顯示文字格式訓練資料以支援自訂語音」。 2025年6月9日
1002 內容 帶有基本方位的 STT 轉錄 語音辨識模型20241218可能錯誤解讀包含方位的音訊輸入。 例如,「SW123456」可能會被轉寫為「Southwest 123456」。其他基本方向也可能發生類似錯誤。 使用自訂顯示格式設定,在重寫規則中將「Southwest」對應為「SW」。 欲了解更多資訊,請參閱 「如何準備顯示文字格式訓練資料以支援自訂語音」。 2025年6月9日
1003 模型 STT 轉錄可能會包含意想不到的系統內部標籤 像「nsnoise」這類意想不到的標籤會出現在轉錄結果中。 此問題最初在阿拉伯模型(ar-SA)中報告,但英語模型(en-US 與 en-GB)也存在。 未來的模型更新會新增篩選器,以從訓練資料中移除「nsnoise」。 沒有解決方法。 未來的版本更新中計畫進行修正。 2025年6月9日
1004 模型 STT 轉譯中語言特定名稱和字詞的拼寫不正確 由於基礎模型對第二層地區的實體覆蓋不足,導致語言特定名稱的轉錄不準確。 這個問題發生在基礎模型之前沒遇過特定詞彙時。 訓練自訂語音模型,將未知姓名與詞彙納入訓練資料。 你也可以在執行時將未知單字作為 片語列表 ,以提升辨識準確度。 2025年6月9日
1005 檔案類型 STT 即時輸出中偶爾會加入脫離上下文的詞彙 僅包含背景噪音的音訊檔案可能導致不準確的轉錄。 理想狀況下,只有口語句子應該被轉錄,但 nl-NL 模型並沒有做到這一點。 使用內建於 Speech SDK 中的 Microsoft Audio Stack (MAS ) 來抑制噪音和回聲消除。 此優化有助於在音訊進入 STT 服務前提升音質。 2025年6月9日
1006 檔案類型 由於「moov atom」位置不當導致 MP4 解碼失敗 解碼 MP4 容器檔案可能會失敗,因為「moov atom」位於檔案的末尾而非開頭。 此結構使目前的服務無法串流處理檔案,尤其是大於 10 MB 的檔案。 透過使用音訊編碼工具將「moov atom」移到開頭,或將檔案轉成 MP3 來預處理檔案。 2025年8月8日

文字轉語音(TTS)功能目前的已知問題

下表列出目前已知的文字轉語音問題:

發行號識別碼 分類 標題 描述 解決方法 發佈日期
2001 服務 透過 REST API 進行模型複製 TTS 服務不允許透過 REST API 進行模型複製以進行災難復原。 沒有解決方法。 這是目前的限制。 2025年6月9日
2002 TTS 頭像 缺少參數 TTS avatar 參數 avatarPositionavatarSize 不支援批次合成。 沒有解決方法。 這是目前的限制。 2025年6月9日
2003 TTS 頭像 缺少 Blob 文件名稱 outputs: result 批次頭像合成作業的 URL 不包含 blob 檔名。 使用 subtitleType = soft_embedded 作為臨時的變通方法。 2025年6月9日
2004 TTS 頭像 TTS avatar 不支援批次合成 批次頭像合成不支援 BYOS,且需要儲存體帳戶允許外部流量。 沒有解決方法。 這是目前的限制。 2025年6月9日
2005 服務 2025 年 7 月遷移後的 DNS 快取更新 亞洲的舊有語音TTS群組於2025年7月31日因合規原因被移除。 所有流量都轉移到新的 IP。 部分客戶可能仍會遇到問題,因為持續存在的本地或次要 DNS 快取尚未刷新。 清除本地和次要 DNS 快取,以解決新 TTS 叢集 IP 的連線問題。 2025年7月24日
2006 TTS 輸出中的字邊界重複 Azure TTS 有時會在合成輸出中回傳重複的字邊界條目,特別是在使用特定 SSML 配置時。 這種重複可能導致時序資料不準確,並在下游應用中出現錯位。 後處理輸出,根據時間戳記和字內容過濾重複的字邊界。 2025年8月8日
2007 TTS 阿拉伯語語音中出現部分產生的字詞 阿拉伯語語音輸出在發音不清晰或不完整的情況下,包含部分生成的詞彙,尤其是以 ة 或 ت 結尾的詞。 這個問題可以在多個聲音中重現。 為了減輕這個問題,可以考慮重新表述語音輸出的文字。 2025年9月16日

語音 SDK/執行階段 作用中的已知問題

下表列出目前已知的語音 SDK/執行時問題:

發行號識別碼 分類 標題 描述 解決方法 發佈日期
3001 SDK 與執行環境 InitialSilenceTimeout 參數會造成 400 次錯誤 InitialSilenceTimeout 為 0 會造成 400 個錯誤。 endSilenceTimeout該參數也可能導致轉錄錯誤——當設定為非 0 的值時,系統會在指定時間後忽略使用者輸入。 使用 InitialSilenceTimeoutMsSpeechConfig.fromSubscription(subscriptionKey, region) 設為 0,以停用因初始靜默而導致的逾時。 單次識別時,會話在初始靜默 30 秒後結束。 為了持續識別,服務會在 30 秒後回報空片語並繼續。 參數 Speech_SegmentationMaximumTimeMs 決定了最大片語長度(預設:30,000 毫秒)。 2025年6月9日
3002 SDK 與執行環境 SegmentationTimeout 參數會導致錯誤詞彙 當 設定超過 1,000 毫秒時 SegmentationSilenceTimeout ,語音辨識結果中會出現隨機單字。 維持預設 SegmentationTimeout 值 650 毫秒。 2025年6月9日
3003 SDK 與執行環境 即時 STT 說話者分離期間缺少說話者持續時間 Python SDK 在使用 STT 的即時對話時不會顯示講者持續時間。 請參閱 對話轉錄結果類別 文件,以檢查結果的偏移量與持續時間。 2025年6月9日
3004 SDK/TTS 虛擬化身 頻繁斷線與 JavaScript SDK 的連接問題 使用 JavaScript SDK 搭配自訂虛擬人偶時,TTS 虛擬人偶無法載入,或經常中斷連線後重新連線。 開啟 UDP 埠 3478。 2025年6月9日

Foundry Tools 中的 Azure 翻譯工具

以下表格描述了目前已知的 Translator 問題。

當前文字翻譯的已知問題

發行號識別碼 分類 標題 描述 解決方法 發佈日期
4001 模型 保留語境與代名詞 有些翻譯模型處理代名詞不佳,尤其是第三人稱代名詞。 這個問題是因為句子層級的訓練和推理無法保留上下文。 產品團隊正積極推動將所有模型轉換為文件層級的訓練與推論。 目前沒有直接的變通方法。 手動檢視並在需要時調整代名詞使用。 2025年2月5日
4002 內容 翻譯混合語言文本的句子 文字翻譯 API 不支援包含混合語言輸入的句子翻譯。 當一句話包含多種語言時,翻譯可能會不正確或不完整。 指定預期的原始語言、移除混合語言句子,或將文本拆分成單一語言段落。 2025年2月5日

文件翻譯 現存的已知問題

發行號識別碼 分類 標題 描述 解決方法 發佈日期
5001 格式化 數學表達式的格式化 翻譯文件可能無法完全保留數學表達式的格式。 上標和下標數字可能會被錯誤地重新格式化。 目前沒有直接的變通方法。 可依需求手動調整數學表達式的格式。 2025年2月5日
5002 內容 翻譯混合原始語言的文件 文件翻譯可能無法翻譯多語言的原始文件,導致結果不正確或不完整。 指定預期的原始語言。 或者,移除混合語言句子,或將文本拆分成僅包含一種語言的段落。 2025年2月5日
5003 檔案類型 複雜文件的翻譯 擁有數千頁複雜文件,在擷取、翻譯及重組過程中可能會遇到故障。 這些文件通常包含圖片、嵌入的文字以及手動打字的文字。 將大型文件拆分成較小的區塊(例如,將一個1,000頁的檔案分成約10個100頁的檔案),並分別提交。 2025年2月5日
5004 格式化 翻譯包含無邊界圖表與表格的文件 圖表與表格中混合了橫直文字、不同儲存格大小或無邊框格線結構,在翻譯過程中難以精確格式化。 透過使用有邊框的表格和圖表而非無邊框的表格來重建文件,以提升翻譯輸出品質。 2025年4月1日
5005 內容 翻譯含有可見浮水印或印章的文件 可見的浮水印或印章可能與文字重疊,使模型難以準確辨識與處理內容。 文件可能未被翻譯,或僅部分翻譯。 使用乾淨、無浮水印的文件,以獲得最佳翻譯效果。 2025年5月21日

Azure Machine Learning

關於與 Azure 機器學習相關的已知問題,請參見 Azure Machine Learning 已知問題