本文列出了 Foundry 已知的問題與解決方法。 在提交支援請求前,請先檢視這些問題。
- 請查看 Azure 狀態頁面 是否有服務等級中斷。
- 在 Azure 服務健康狀態 入口網站設定停機通知。
代理服務
目前沒有已知的活躍問題。
鑄造工具
Azure 語音在鑄造工具中的應用
以下表格描述目前已知的語音問題,包括語音轉文字(STT)、文字轉語音(TTS)及語音 SDK/執行時。
STT 語音轉文字目前已知問題
下表列出目前已知的語音轉文字問題:
| 發行號識別碼 | 分類 | 標題 | 描述 | 解決方法 | 發佈日期 |
|---|---|---|---|---|---|
| 1001 | 內容 | STT 轉錄(以磅單位為單位) | 即時轉錄通常會在使用英國口音時,無論語言設定為何,將「pounds」錯誤轉換為「lbs」。 | 使用自訂顯示後處理 (DPP) 訓練自訂語音模型,以修正預設 DPP 結果 (例如,Pounds {tab} Pounds)。 欲了解更多資訊,請參閱 「如何準備顯示文字格式訓練資料以支援自訂語音」。 | 2025年6月9日 |
| 1002 | 內容 | 帶有基本方位的 STT 轉錄 | 語音辨識模型20241218可能錯誤解讀包含方位的音訊輸入。 例如,「SW123456」可能會被轉寫為「Southwest 123456」。其他基本方向也可能發生類似錯誤。 | 使用自訂顯示格式設定,在重寫規則中將「Southwest」對應為「SW」。 欲了解更多資訊,請參閱 「如何準備顯示文字格式訓練資料以支援自訂語音」。 | 2025年6月9日 |
| 1003 | 模型 | STT 轉錄可能會包含意想不到的系統內部標籤 | 像「nsnoise」這類意想不到的標籤會出現在轉錄結果中。 此問題最初在阿拉伯模型(ar-SA)中報告,但英語模型(en-US 與 en-GB)也存在。 未來的模型更新會新增篩選器,以從訓練資料中移除「nsnoise」。 | 沒有解決方法。 未來的版本更新中計畫進行修正。 | 2025年6月9日 |
| 1004 | 模型 | STT 轉譯中語言特定名稱和字詞的拼寫不正確 | 由於基礎模型對第二層地區的實體覆蓋不足,導致語言特定名稱的轉錄不準確。 這個問題發生在基礎模型之前沒遇過特定詞彙時。 | 訓練自訂語音模型,將未知姓名與詞彙納入訓練資料。 你也可以在執行時將未知單字作為 片語列表 ,以提升辨識準確度。 | 2025年6月9日 |
| 1005 | 檔案類型 | STT 即時輸出中偶爾會加入脫離上下文的詞彙 | 僅包含背景噪音的音訊檔案可能導致不準確的轉錄。 理想狀況下,只有口語句子應該被轉錄,但 nl-NL 模型並沒有做到這一點。 | 使用內建於 Speech SDK 中的 Microsoft Audio Stack (MAS ) 來抑制噪音和回聲消除。 此優化有助於在音訊進入 STT 服務前提升音質。 | 2025年6月9日 |
| 1006 | 檔案類型 | 由於「moov atom」位置不當導致 MP4 解碼失敗 | 解碼 MP4 容器檔案可能會失敗,因為「moov atom」位於檔案的末尾而非開頭。 此結構使目前的服務無法串流處理檔案,尤其是大於 10 MB 的檔案。 | 透過使用音訊編碼工具將「moov atom」移到開頭,或將檔案轉成 MP3 來預處理檔案。 | 2025年8月8日 |
文字轉語音(TTS)功能目前的已知問題
下表列出目前已知的文字轉語音問題:
| 發行號識別碼 | 分類 | 標題 | 描述 | 解決方法 | 發佈日期 |
|---|---|---|---|---|---|
| 2001 | 服務 | 透過 REST API 進行模型複製 | TTS 服務不允許透過 REST API 進行模型複製以進行災難復原。 | 沒有解決方法。 這是目前的限制。 | 2025年6月9日 |
| 2002 | TTS 頭像 | 缺少參數 | TTS avatar 參數 avatarPosition 和 avatarSize 不支援批次合成。 |
沒有解決方法。 這是目前的限制。 | 2025年6月9日 |
| 2003 | TTS 頭像 | 缺少 Blob 文件名稱 |
outputs: result 批次頭像合成作業的 URL 不包含 blob 檔名。 |
使用 subtitleType = soft_embedded 作為臨時的變通方法。 |
2025年6月9日 |
| 2004 | TTS 頭像 | TTS avatar 不支援批次合成 | 批次頭像合成不支援 BYOS,且需要儲存體帳戶允許外部流量。 | 沒有解決方法。 這是目前的限制。 | 2025年6月9日 |
| 2005 | 服務 | 2025 年 7 月遷移後的 DNS 快取更新 | 亞洲的舊有語音TTS群組於2025年7月31日因合規原因被移除。 所有流量都轉移到新的 IP。 部分客戶可能仍會遇到問題,因為持續存在的本地或次要 DNS 快取尚未刷新。 | 清除本地和次要 DNS 快取,以解決新 TTS 叢集 IP 的連線問題。 | 2025年7月24日 |
| 2006 | TTS | 輸出中的字邊界重複 | Azure TTS 有時會在合成輸出中回傳重複的字邊界條目,特別是在使用特定 SSML 配置時。 這種重複可能導致時序資料不準確,並在下游應用中出現錯位。 | 後處理輸出,根據時間戳記和字內容過濾重複的字邊界。 | 2025年8月8日 |
| 2007 | TTS | 阿拉伯語語音中出現部分產生的字詞 | 阿拉伯語語音輸出在發音不清晰或不完整的情況下,包含部分生成的詞彙,尤其是以 ة 或 ت 結尾的詞。 這個問題可以在多個聲音中重現。 | 為了減輕這個問題,可以考慮重新表述語音輸出的文字。 | 2025年9月16日 |
語音 SDK/執行階段 作用中的已知問題
下表列出目前已知的語音 SDK/執行時問題:
| 發行號識別碼 | 分類 | 標題 | 描述 | 解決方法 | 發佈日期 |
|---|---|---|---|---|---|
| 3001 | SDK 與執行環境 | InitialSilenceTimeout 參數會造成 400 次錯誤 | 設 InitialSilenceTimeout 為 0 會造成 400 個錯誤。
endSilenceTimeout該參數也可能導致轉錄錯誤——當設定為非 0 的值時,系統會在指定時間後忽略使用者輸入。 |
使用 InitialSilenceTimeoutMs 將 SpeechConfig.fromSubscription(subscriptionKey, region) 設為 0,以停用因初始靜默而導致的逾時。 單次識別時,會話在初始靜默 30 秒後結束。 為了持續識別,服務會在 30 秒後回報空片語並繼續。 參數 Speech_SegmentationMaximumTimeMs 決定了最大片語長度(預設:30,000 毫秒)。 |
2025年6月9日 |
| 3002 | SDK 與執行環境 | SegmentationTimeout 參數會導致錯誤詞彙 | 當 設定超過 1,000 毫秒時 SegmentationSilenceTimeout ,語音辨識結果中會出現隨機單字。 |
維持預設 SegmentationTimeout 值 650 毫秒。 |
2025年6月9日 |
| 3003 | SDK 與執行環境 | 即時 STT 說話者分離期間缺少說話者持續時間 | Python SDK 在使用 STT 的即時對話時不會顯示講者持續時間。 | 請參閱 對話轉錄結果類別 文件,以檢查結果的偏移量與持續時間。 | 2025年6月9日 |
| 3004 | SDK/TTS 虛擬化身 | 頻繁斷線與 JavaScript SDK 的連接問題 | 使用 JavaScript SDK 搭配自訂虛擬人偶時,TTS 虛擬人偶無法載入,或經常中斷連線後重新連線。 | 開啟 UDP 埠 3478。 | 2025年6月9日 |
Foundry Tools 中的 Azure 翻譯工具
以下表格描述了目前已知的 Translator 問題。
當前文字翻譯的已知問題
| 發行號識別碼 | 分類 | 標題 | 描述 | 解決方法 | 發佈日期 |
|---|---|---|---|---|---|
| 4001 | 模型 | 保留語境與代名詞 | 有些翻譯模型處理代名詞不佳,尤其是第三人稱代名詞。 這個問題是因為句子層級的訓練和推理無法保留上下文。 產品團隊正積極推動將所有模型轉換為文件層級的訓練與推論。 | 目前沒有直接的變通方法。 手動檢視並在需要時調整代名詞使用。 | 2025年2月5日 |
| 4002 | 內容 | 翻譯混合語言文本的句子 | 文字翻譯 API 不支援包含混合語言輸入的句子翻譯。 當一句話包含多種語言時,翻譯可能會不正確或不完整。 | 指定預期的原始語言、移除混合語言句子,或將文本拆分成單一語言段落。 | 2025年2月5日 |
文件翻譯 現存的已知問題
| 發行號識別碼 | 分類 | 標題 | 描述 | 解決方法 | 發佈日期 |
|---|---|---|---|---|---|
| 5001 | 格式化 | 數學表達式的格式化 | 翻譯文件可能無法完全保留數學表達式的格式。 上標和下標數字可能會被錯誤地重新格式化。 | 目前沒有直接的變通方法。 可依需求手動調整數學表達式的格式。 | 2025年2月5日 |
| 5002 | 內容 | 翻譯混合原始語言的文件 | 文件翻譯可能無法翻譯多語言的原始文件,導致結果不正確或不完整。 | 指定預期的原始語言。 或者,移除混合語言句子,或將文本拆分成僅包含一種語言的段落。 | 2025年2月5日 |
| 5003 | 檔案類型 | 複雜文件的翻譯 | 擁有數千頁複雜文件,在擷取、翻譯及重組過程中可能會遇到故障。 這些文件通常包含圖片、嵌入的文字以及手動打字的文字。 | 將大型文件拆分成較小的區塊(例如,將一個1,000頁的檔案分成約10個100頁的檔案),並分別提交。 | 2025年2月5日 |
| 5004 | 格式化 | 翻譯包含無邊界圖表與表格的文件 | 圖表與表格中混合了橫直文字、不同儲存格大小或無邊框格線結構,在翻譯過程中難以精確格式化。 | 透過使用有邊框的表格和圖表而非無邊框的表格來重建文件,以提升翻譯輸出品質。 | 2025年4月1日 |
| 5005 | 內容 | 翻譯含有可見浮水印或印章的文件 | 可見的浮水印或印章可能與文字重疊,使模型難以準確辨識與處理內容。 文件可能未被翻譯,或僅部分翻譯。 | 使用乾淨、無浮水印的文件,以獲得最佳翻譯效果。 | 2025年5月21日 |
Azure Machine Learning
關於與 Azure 機器學習相關的已知問題,請參見 Azure Machine Learning 已知問題。