Azure AI 語音有何新功能？

發行項
04/22/2024

Azure AI 語音會持續更新。為了讓您隨時掌握最新的開發訊息，此文章提供有關新版本與新功能的資訊。

版本資訊

選擇服務或資源

即將推出的 Linux 和 Android 使用者方案：

警告

本文參考 CentOS，這是接近生命週期結束 (EOL) 狀態的 Linux 發行版本。請據此考慮您的使用方式和規劃。如需詳細資訊，請參閱 CentOS 生命週期結束指導。

Ubuntu 18.04 也於 2023 年 4 月結束生命週期，因此我們的使用者應該為我們準備將最低版本移至 Ubuntu 20.04。

語音 SDK 1.37.0：2024 年 4 月版本

新功能

新增語音合成中輸入文字串流的支援。
將預設語音合成語音變更為 en-US-AvaMultilingualNeural。
更新 Android 組建以使用 OpenSSL 3.x。

錯誤修正

修正使用 MAS 時，在 SpeechRecognizer 處置期間偶爾發生 JVM 當機的問題。（https://github.com/Azure-Samples/cognitive-services-speech-sdk/issues/2125）
改善 Linux 上預設音訊裝置的偵測。（https://github.com/Azure-Samples/cognitive-services-speech-sdk/issues/2292）

範例

已更新新功能。

語音 SDK 1.36.0：2024 年 3 月版本

新功能

使用 AutoDetectSourceLanguageConfig：：FromOpenRange（）在 v2 端點上新增語言識別支援。

錯誤修正

修正在 SynthesisStarted 事件期間呼叫 stop 時未引發的 SynthesisCanceled 事件。
修正內嵌語音合成中的雜訊問題。
在平行執行多個辨識器時，修正內嵌語音辨識中的當機問題。
修正 v1/v2 端點上的片語偵測模式設定。
修正 Microsoft Audio Stack 的各種問題。

範例

更新新功能。

語音 SDK 1.35.0：2024 年 2 月版本

新功能

將默認文字變更為語音語音，從 en-US-JennyMultilingualNeural 變更為 en-US-AvaNeural。
使用詳細的輸出格式，支援內嵌語音翻譯結果中的文字層級詳細數據。

錯誤修正

修正 Python 中的 AudioDataStream 位置 getter API。
使用 v2 端點修正語音翻譯，而不需要語言偵測。
修正內嵌文字到語音轉換中的隨機當機和重複字邊界事件。
針對 WebSocket 連線上的內部伺服器錯誤，傳回正確的取消錯誤碼。
修正當 MAS 與 C# 搭配使用時，無法載入FPIEProcessor.dll連結庫。

範例

內嵌辨識範例的次要格式設定更新。

語音 SDK 1.34.1：2024 年 1 月版本

重大變更

僅限錯誤修正

新功能

僅限錯誤修正

錯誤修正

修正在 1.34.0 中引進的回歸，其中服務端點 URL 是以數個中國區域中使用者不正確的地區設定資訊所建構。

語音 SDK 1.34.0：2023 年 11 月版本

重大變更

SpeechRecognizer 已更新為預設使用新的端點（也就是未明確指定 URL 時），該 URL 不再支援大部分屬性的查詢字串參數。請使用對應的 API 函式，而不是使用 ServicePropertyChannel.UriQueryParameter 直接設定查詢字串參數。

新功能

與 .NET 8 的兼容性（修正， https://github.com/Azure-Samples/cognitive-services-speech-sdk/issues/2170 但 centos7-x64 警告除外）
支援內嵌語音效能計量，可用來評估裝置執行內嵌語音的功能。
支援內嵌多語系翻譯中的來源語言識別。
支援預覽版中發行的 iOS 和 Swift/Objective-C 的內嵌語音轉換文字、文字到語音轉換和翻譯。
MicrosoftCognitiveServicesSpeechEmbedded-iOS Cocoapod 提供內嵌支援。

錯誤修正

修正 iOS SDK x2 倍二進位大小成長 •問題 #2113 •Azure-Samples/cognitive-services-speech-sdk （github.com）
修正無法從 Azure 語音到文字 API 取得文字層級時間戳。問題 #2156 •Azure-Samples/cognitive-services-speech-sdk （github.com）
修正 DialogService 連線或解構階段，以正確中斷事件連線。這偶爾會造成當機。
修正在使用 MAS 時建立辨識器時的例外狀況。
適用於 Windows UWP x64 和 ARM64 的 Microsoft.CognitiveServices.Speech.Extension.MAS NuGet 套件FPIEProcessor.dll相依於原生 C++ 的 VC 運行時間連結庫。已修正此問題，方法是更新相依性以更正 VC 運行時間連結庫（適用於 UWP）。
修正 [MAS] 辨識OnceAsync 的迴圈呼叫會導致在使用 MAS 時SPXERR_ALREADY_INITIALIZED。問題 #2124 •Azure-Samples/cognitive-services-speech-sdk （github.com）
修正使用片語清單時內嵌語音辨識當機的問題。

範例

語音轉換文字、文字到語音轉換和翻譯的內嵌iOS範例。

語音 CLI 1.34.0：2023 年 11 月版本

新功能

在合成語音時支援文字界限事件輸出。

錯誤修正

已將 JMESPath 相依性更新為最新版本，以改善字串評估

語音 SDK 1.33.0：2023 年 10 月版本

重大變更通知

Microsoft Audio Stack （MAS）新增的新 NuGet 套件現在必須包含在套件組態檔中使用 MAS 的應用程式。

新功能

已新增新的 NuGet 套件 Microsoft.CognitiveServices.Speech.Extension.MAS.nupkg，可在使用 Microsoft Audio Stack 時提供改善的回應取消效能
發音評量：新增了對音素和內容評估的支援，其可在語言、詞彙、文法和主題方面評估口語語音。

錯誤修正

已修正關鍵詞辨識結果位移，使其自一開始就正確地符合輸入音訊數據流。修正適用於獨立關鍵詞辨識和關鍵詞觸發的語音辨識。
修正合成器 stopSpeaking 不會立即傳回 SPXSpeechSynthesizer stopSpeaking（）方法無法在 iOS 17 上立即傳回 - 問題 #2081
已修正使用 apple silicon 的 Swift 模組支援 mac 催化劑的 Mac 催化劑匯入問題。問題 #1948
JS：AudioWorkletNode 模組載入現在會使用受信任的 URL，且 CDN 瀏覽器包含後援。
JS：已封裝的 lib 檔案現在以 ES6 JS 為目標，且已移除對 ES5 JS 的支援。
JS：已正確處理以 v2 端點為目標之轉譯案例的中繼事件
JS： TranslationRecognitionEventArgs 的語言屬性現在已設定為 translation.假說事件。
語音合成：SynthesisCompleted 事件保證會在所有元數據事件之後發出，因此可用來指出事件結尾。如何偵測何時完全接收 visemes？問題 #2093 Azure-Samples/cognitive-services-speech-sdk

範例

已新增範例以示範使用 Python 的 MULAW 串流）
修正語音轉換文字 NAudio 範例

語音 CLI 1.33.0：2023 年 10 月版本

新功能

在合成語音時支援文字界限事件輸出。

錯誤修正

none

語音 SDK 1.32.1：2023 年 9 月版本

錯誤修正

Android 套件會使用 OpenSSL1.1.1v 的最新安全性修正進行更新
JS – 新增 WebWorkerLoadType 屬性以允許略過逾時背景工作角色的數據 URL 載入
JS – 修正 10 分鐘後的交談翻譯中斷連線
JS – 對話翻譯驗證令牌現在會傳播至翻譯服務連線

範例

使用 Swift API 進行交談轉譯

語音 SDK 1.31.0：2023 年 8 月版本

新功能

語音 SDK 1.31.0 公開預覽中提供即時自動分段標記的支援。這項功能適用於下列 SDK：C#、C++、JAVA、JavaScript、Python 和 Objective-C/Swift。
使用音訊播放同步的語音合成字邊界和描聲影像事件

重大變更

先前的「對話謄寫」案例已重新命名為「會議謄寫」。例如，使用 MeetingTranscriber 而非 ConversationTranscriber，並使用 CreateMeetingAsync 而非 CreateConversationAsync。雖然 SDK 物件和方法的名稱已變更，但重新命名不會變更功能本身。使用會議謄寫物件來謄寫具有使用者設定檔和語音簽章的會議。如需詳細資訊，請參閱會議謄寫。這些變更不會影響「對話翻譯」物件和方法。您仍然可以針對會議翻譯案例使用 ConversationTranslator 物件及其方法。

針對即時自動分段標記，會導入新的 ConversationTranscriber 物件。新的「對話謄寫」物件模型和呼叫模式類似於 SpeechRecognizer 物件的持續辨識。主要差異在於 ConversationTranscriber 物件是設計成用於對話案例中，您想要區分多個說話者 (自動分段標記)。使用者設定檔和語音簽章不適用。如需詳細資訊，請參閱即時自動分段標記快速入門。

下表顯示即時自動分段標記和會議謄寫的先前和新物件名稱。案例名稱位於第一個資料行，前一個物件名稱位於第二個資料行中，而新的物件名稱則位於第三個資料行中。

案例名稱	先前的物件名稱	新的物件名稱
即時自動分段標記	N/A	`ConversationTranscriber`
會議謄寫	`ConversationTranscriber` `ConversationTranscriptionEventArgs` `ConversationTranscriptionCanceledEventArgs` `ConversationTranscriptionResult` `RemoteConversationTranscriptionResult` `RemoteConversationTranscriptionClient` `RemoteConversationTranscriptionResult` `Participant`¹ `ParticipantChangedReason`¹ `User`¹	`MeetingTranscriber` `MeetingTranscriptionEventArgs` `MeetingTranscriptionCanceledEventArgs` `MeetingTranscriptionResult` `RemoteMeetingTranscriptionResult` `RemoteMeetingTranscriptionClient` `RemoteMeetingTranscriptionResult` `Participant` `ParticipantChangedReason` `User` `Meeting`²

¹Participant、ParticipantChangedReason 和 User 物件同時適用於會議謄寫和會議翻譯案例。

²Meeting 物件是新的，會與 MeetingTranscriber 物件搭配使用。

錯誤修正

已修正 macOS 最低支援版本 https://github.com/Azure-Samples/cognitive-services-speech-sdk/issues/2017
已修正發音評估錯誤：
- 解決 phoneme 精確度分數問題，確保它們現在只準確地反映特定的錯誤音素。 https://github.com/Azure-Samples/cognitive-services-speech-sdk/issues/1917
- 已解決發音評估功能不正確將完全正確發音識別為錯誤的問題，特別是在單字可能有多個有效發音的情況下。 https://github.com/Azure-Samples/cognitive-services-speech-sdk/issues/1530

範例

CSharp
- 新 C# 對話謄寫快速入門
- 新 C# 會議謄寫快速入門
JavaScript

語音 SDK 1.30.0：2023 年 7 月版本

新功能

C++、C#、JAVA - 已新增內嵌語音辨識詳細結果中 DisplayWords 的支援。
Objective-C/Swift - 已新增 Objective-C/Swift 中 ConnectionMessageReceived 事件的支援。
Objective-C/Swift - 改善 iOS 的關鍵字現成模型。這項變更增加了特定套件的大小，其中包含iOS二進位檔（例如 NuGet、XCFramework）。我們正在努力減少未來版本的大小。

錯誤修正

已修正搭配 PhraseListGrammar 使用語音辨識器時的記憶體流失，如客戶回報 (GitHub 問題)。
已修正文字到語音開啟連線 API 中的死結。

其他注意事項

JAVA - 某些內部使用的 publicJAVA API 方法已變更為封裝 internal、protected 或 private。這項變更不應該對開發人員產生影響，因為我們不會預期應用程式正在使用那些變更。此處已針對透明度所述。

範例

如何在您自己的應用程式中指定學習語言的新發音評定範例
- C#：請參閱範例程式碼。
- C++：請參閱範例程式碼。
- JavaScript：請參閱範例程式碼。
- Objective-C：請參閱範例程式碼。
- Python：請參閱範例程式碼。
- Swift：請參閱範例程式碼。

語音 SDK 1.29.0：2023 年 6 月版本

新功能

C++、C#、JAVA - 內嵌語音翻譯 API 的預覽。現在您可以執行語音翻譯，而不需要雲端連線！
JavaScript - 已針對語音翻譯啟用連續語言識別 (LID)。
JavaScript - 將 LocaleName 屬性新增至 VoiceInfo 類別的社群貢獻。感謝您 GitHub 使用者 shivsarthak 進行提取要求。
C++、C#、Java - 新增將內嵌文字重新取樣至語音輸出的支援，從 16 kHz 到 48 kHz 取樣率。
已新增在意圖識別器中使用樣本模式比對 hi-IN 的地區設定支援。

錯誤修正

已修正在物件解構期間，語音辨識器競爭條件所造成的損毀，如某些 Android 測試所示
已修正使用樣本模式比對器在意圖識別器中可能的死結

範例

新的內嵌語音翻譯範例

語音 SDK 1.28.0：2023 年 5 月版本

重大變更

JavaScript SDK：已移除線上憑證狀態通訊協定 (OCSP)。這可讓用戶端更符合憑證處理的瀏覽器和 Node 標準。 1.28 版和更新版本將不再包含我們的自訂 OCSP 模組。

新功能

內嵌語音辨識現在會在語句結束時發生無回應逾時時傳回 NoMatchReason::EndSilenceTimeout。這符合使用即時語音服務進行辨識時的行為。
JavaScript SDK：使用 PropertyId 列舉值設定 SpeechTranslationConfig 上的屬性。

錯誤修正

Windows 上的 C# - 修正 Windows 音訊延伸模組中的潛在競爭條件/死結。在同時快速處置音訊轉譯器，以及使用合成器方法來停止說話的情況下，基礎事件不會由停止重設，而且可能會導致轉譯器物件永遠不會處置，同時它可能會保留全域鎖定以處置，凍結 dotnet GC 執行緒。

範例

已新增 MAUI 的內嵌語音範例。
已更新 Android Java 的內嵌語音範例，以包含文字到語音轉換。

語音 SDK 1.27.0：2023 年 4 月版本

即將進行的變更通知

我們計畫在下一個 JavaScript SDK 版本中移除線上憑證狀態通訊協定 (OCSP)。這可讓用戶端更符合憑證處理的瀏覽器和 Node 標準。 1.27 版是包含我們自訂 OCSP 模組的最後一個版本。

新功能

JavaScript – 已新增使用說話者辨識和驗證從瀏覽器輸入麥克風的支援。
內嵌語音辨識 - 更新 PropertyId::Speech_SegmentationSilenceTimeoutMs 設定的支援。

錯誤修正

一般 - 服務重新連線邏輯中的可靠性更新 (JavaScript 以外的所有程式設計語言)。
一般 - 修正 Windows (除了 JavaScript 以外所有相關程式設計語言) 上的字串轉換流失記憶體。
內嵌語音辨識 - 修正使用特定文法清單項目時法文語音辨識損毀的問題。
原始程式碼文件 - 修正 SDK 參考文件註解，與服務上的音訊記錄相關。
意圖辨識 - 修正與清單實體相關的模式比對器優先順序。

範例

在 C# 對話謄寫 (CTS) 樣本中正確處理驗證失敗。
已新增 Python、JavaScript、Objective-C 和 Swift 的串流發音評估範例。

語音 SDK 1.26.0：2023 年 3 月版本

重大變更

下列套件中的所有 iOS 目標都已停用 Bitcode：Cocoapod with xcframework、NuGet (適用於 Xamarin 和 MAUI) 和 Unity。此變更是因為 Apple 從 Xcode 14 和更新版本取代 Bitcode 支援。這項變更也表示如果您使用 Xcode 13 版本，或者您已使用語音 SDK 明確啟用應用程式上的 Bitcode，您可能會遇到錯誤，指出「架構不包含 Bitcode，而且您必須重建它」。若要解決此問題，請確定您的目標已停用 Bitcode。
此版本中的最低 iOS 部署目標已升級為 11.0，這表示不再支援 armv7 HW。

新功能

內嵌 (裝置上) 語音辨識現在支援 8 和 16-kHz 取樣率輸入音訊 (每個樣本 16-bit、單聲道 PCM)。
語音合成現在會報告結果中的連線、網路和服務延遲，以協助端對端延遲最佳化。
使用樣本模式比對進行意圖辨識的新中斷規則。比對的字元位元組越多，將會勝過具有較低字元位元組計數的模式比對。範例：模式「選取右上方的 {something}」將會勝過「選取 {something}」

錯誤修正

語音合成：修正 Emoji 在字邊界事件中不正確的錯誤。
使用對話式語言理解的意圖辨識（CLU）：
- 來自 CLU Orchestrator 工作流程的意圖現在會正確出現。
- JSON 結果現在可透過屬性識別碼 LanguageUnderstandingServiceResponse_JsonResult 取得。
使用關鍵字啟用的語音辨識：修正關鍵字辨識之後遺漏 ~150 毫秒的音訊。
修正語音 SDK NuGet iOS MAUI 發行組建，客戶 (GitHub 問題)

範例

修正由客戶回報的 Swift iOS 範例 (GitHub 問題)

語音 SDK 1.25.0：2023 年 1 月版本

重大變更

語言識別 (預覽) API 已經過簡化。如果您更新為語音 SDK 1.25 並看到建置中斷，請瀏覽 [語言識別] 頁面以了解新的屬性 SpeechServiceConnection_LanguageIdMode。這個單一屬性會取代前兩個 SpeechServiceConnection_SingleLanguageIdPriority 和 SpeechServiceConnection_ContinuousLanguageIdPriority 屬性。在最近的模型改進之後，不再需要在低延遲和高精確度之間設定優先順序。現在，您只需要選取在執行連續語音辨識或翻譯時，是否要在啟動時執行或連續語言識別。

新功能

C#/C++/JAVA：內嵌語音 SDK 現已在受閘道公開預覽下發行。請參閱內嵌語音 (預覽) 文件。當雲端連線斷斷續續或無法使用時，您現在可以進行裝置上的語音轉換文字和文字轉換語音。已支援 Android、Linux、macOS 和 Windows 平台
C# MAUI：在語音 SDK NuGet (客戶問題) 中已新增 iOS 和 Mac Catalyst 目標的支援
Unity：Android x86_64架構已新增至 Unity 套件 (客戶問題)
Go：
- 已針對語音辨識 (客戶問題) 新增 ALAW/MULAW 直接串流支援
- 已新增 PhraseListGrammar 的支援。感謝您 GitHub 使用者 czkoko 對社群貢獻！
C#/C++：意圖識別器現在支援 C++ 和 C# 中以及 Microsoft 服務上協調流程的交談語言理解模型

錯誤修正

修正在嘗試停止 KeywordRecognizer 時偶爾停止回應的問題
Python：
- 修正 PronunciationAssessmentGranularity.FullText 設定時取得發音評定結果 (客戶問題)
- 修正取得語音合成語音時未擷取男性語音的性別屬性
JavaScript
- 修正在 iOS 裝置 (客戶問題) 上記錄的一些 WAV 檔案
- JS SDK 現在會建置而不使用 npm-force-resolutions (Customer 問題)
- 使用使用 SpeechConfig.fromEndpoint() 建立的 speechConfig 執行個體時，對話翻譯工具現在已正確設定服務端點

範例

已新增示範如何使用內嵌語音的範例
已新增 MAUI 的語音轉換文字範例

請參閱語音 SDK 範例存放庫。

語音 SDK 1.24.2：2022 年 11 月版本

新功能

沒有新功能，只要內嵌引擎修正即可支援新的模型檔案。

錯誤修正

所有程式設計語言
- 已修正內嵌語音辨識模型的加密問題。

語音 SDK 1.24.1：2022 年 11 月版本

新功能

內嵌語音預覽的已發佈套件。如需相關資訊，請參閱 https://aka.ms/embedded-speech 。

錯誤修正

所有程式設計語言
- 修正不支援語音字型時的內嵌 TTS 損毀
- 修正 stopSpeaking() 無法在 Linux (#1686) 上停止播放
JavaScript SDK
- 修正對話轉譯網關音訊方式的回歸。
Java
- 暫時將 POM 和 Javadocs 檔案發佈至 Maven Central，讓檔管線能夠更新在線參考檔。
Python
- 修正 Python speak_text（ssml）傳回 void 的回歸。

語音 SDK 1.24.0：2022 年 10 月版本

新功能

所有程式設計語言：AMR-WB (16khz) 新增至支援的文字轉換語音音訊輸出格式清單
Python：針對支援的 Linux 發行版新增 Linux ARM64 套件。
C#/C++/Java/Python：使用 AudioStreamWaveFormat新增了 ALAW 和 MULAW 直接串流至語音服務的支援（除了現有的 PCM 串流）。
C# MAUI：已更新 NuGet 套件以支援適用於 .NET MAUI 開發人員的 Android 目標（客戶問題）
Mac：已新增個別的 XCframework for Mac，其中不包含任何 iOS 二進位檔。這為僅需要使用較小 XCframework 套件的 Mac 二進位檔的開發人員提供選項。
Microsoft Audio Stack （MAS）：
- 當指定梁形成角度時，源自指定範圍以外的音效將會更好地抑制。
- Linux ARM32 和 Linux ARM64 的大小 libMicrosoft.CognitiveServices.Speech.extension.mas.so 大約減少了 70%。
使用模式比對的意圖辨識：
- 新增語言fr、 dees的正圖支援jp
- 已新增語言 es 的預先建置整數支援。

錯誤修正

iOS：修正 iOS 16 語音合成錯誤，原因是壓縮音訊譯碼失敗（客戶問題）。
JavaScript：
- 修正取得語音合成語音清單時無法運作的驗證令牌（客戶問題）。
- 使用數據 URL 來載入背景工作角色（客戶問題）。
- 只有在瀏覽器支援 AudioWorklet 時，才建立音訊處理器工作程式（客戶問題）。這是黃威廉的一個社區貢獻。謝謝威廉！
- 修正 LUIS 回應 connectionMessage 空白時辨識的回呼（客戶問題）。
- 正確設定語音分割逾時。
使用模式比對的意圖辨識：
- 模型內的非 JSON 字元現在會正確載入。
- 修正在連續辨識期間呼叫時 recognizeOnceAsync(text) 發生的問題。

語音 SDK 1.23.0：2022 年 7 月版本

新功能

C#、C++、Java：已新增語言zh-cnzh-hk和意圖辨識與模式比對的支援。
C#：已新增 . AnyCPU NET Framework 組建的支援

錯誤修正

Android：將 OpenSSL 更新為 1.1.1q，修正 OpenSSL 弱點 CVE-2022-2068
Python：修正使用 PushAudioInputStream 時的當機問題
iOS：修正「EXC_BAD_ACCESS：嘗試取值 null 指標」，如 iOS 上所回報（GitHub 問題）

語音 SDK 1.22.0：2022 年 6 月版本

新功能

JAVA：已新增適用於 getEntities ()、applyLanguageModels () 和 recognizeOnceAsync(text) 的 IntentRecognitionResult API，以支援「樣本模式比對」引擎。
Unity：已新增 Unity 套件的 Mac M1 （Apple Silicon）支援（GitHub 問題）
C#：已新增 Xamarin Android x86_64支援（GitHub 問題）
C#： .NET Framework 最低版本已更新為 v4.6.2 for SDK C# 套件，因為 v4.6.1 已淘汰（請參閱 Microsoft .NET Framework 元件生命周期原則）
Linux：已新增Debian 11和Ubuntu 22.04 LTS的支援。 Ubuntu 22.04 LTS 需要從此處手動安裝 libssl1.1 做為二進位套件 (例如 libssl1.1_1.1.1l-1ubuntu1.3_amd64.deb 或適用於 x64 的更新版本)，或從來源編譯。

錯誤修正

UWP：已從 UWP 連結庫移除 OpenSSL 相依性，並以 WinRT Websocket 和 HTTP API 取代，以符合安全性合規性和較小的二進位使用量。
Mac：已修正使用以 macOS 平台為目標的 Swift 專案時發生「找不到 MicrosoftCognitiveServicesSpeech 模組」問題
Windows、Mac：修正了透過屬性設定的音訊來源以即時速率串流的平臺特定問題，有時會落後，最終超過容量

範例（GitHub）

C#：更新為使用 v4.6.2 的 .NET Framework 範例
Unity：適用於 Android 和 UWP 的虛擬助理範例
Unity：Unity 2020 LTS 版本的 Unity 範例已更新

語音 SDK 1.21.0：2022 年 4 月版本

新功能

Java 和 JavaScript：在使用 SpeechRecognizer 物件時新增了連續語言識別的支援
JavaScript：已新增診斷 API 以啟用控制台記錄層級和（僅限節點）檔案記錄，以協助 Microsoft 針對客戶回報的問題進行疑難解答
Python：已新增對話轉譯的支援
Go：已新增說話者辨識的支援
C++ 和 C#：已新增意圖辨識器中所需單字群組的支持（簡單模式比對）。例如：「set|start|begin）定時器“，其中”set“、”start“ 或 ”begin“ 必須存在，才能辨識意圖。
所有程式設計語言語音合成：在字邊界事件中新增持續時間屬性。已新增標點符號界限和句子界限的支援
Objective-C/Swift/Java：在發音評估結果物件上新增文字層級結果（類似於 C#）。應用程式不再需要剖析 JSON 結果字串以取得文字層級資訊（GitHub 問題）
iOS 平臺：新增 ARMv7 架構的實驗性支援

錯誤修正

iOS 平台：修正使用 CocoaPod 時，允許針對目標「任何 iOS 裝置」進行建置 (GitHub 問題)
Android 平臺：OpenSSL 版本已更新為 1.1.1n，以修正安全性弱點 CVE-2022-0778
JavaScript：修正未以檔案大小更新 wav 標頭的問題 (GitHub 問題)
JavaScript：修正要求標識符中斷性轉譯案例的問題（GitHub 問題）
JavaScript：修正具現化無數據流的 SpeakerAudioDestination 時的問題（GitHub 問題]
C++：修正 C++ 標頭以在編譯 C++17 或更新版時移除警告

範例 GitHub

使用語言識別進行語音辨識的新 Java 範例
交談轉譯的新 Python 和 Java 範例
說話者辨識的新 Go 範例
全新 C++ 和 C# 工具，適用於 Windows 列舉所有音訊擷取和轉錄裝置，以尋找其裝置識別碼。如果您打算從非預設裝置擷取音訊或轉譯音訊，語音 SDK 需要此標識符。

語音 SDK 1.20.0：2022 年 1 月版本

新功能

Objective-C、Swift 和 Python：已新增 DialogService 連線 or 的支援，用於語音助理案例。
Python：已新增 Python 3.10 的支援。已移除 Python 3.6 的支援，每個 Python 的生命周期結束 3.6。
Unity：Linux 上的 Unity 應用程式現在支援語音 SDK。
C++、C#：C# 現在支援使用模式比對的 IntentRecognizer。此外，C++ 和 C# 現在支援自定義實體、選擇性群組和實體角色的案例。
C++、C#：使用新的類別 FileLogger、MemoryLogger 和 EventLogger 改善診斷追蹤記錄。 SDK 記錄是 Microsoft 診斷客戶回報問題的重要工具。這些新類別可讓客戶更輕鬆地將語音 SDK 記錄整合到自己的記錄系統中。
所有程式設計語言：發音AssessmentConfig 現在都有屬性可設定所需的音素字母（IPA 或 SAPI）和 N-Best 電話 me Count（避免需要根據 GitHub 問題 1284 撰寫設定 JSON）。此外，現在支援音節層級輸出。
Android、iOS 和 macOS (所有程式設計語言)：不再需要 GStreamer 就能支援受限頻寬網路。 SpeechSynthesizer 現在會使用作業系統的音訊解碼功能，以解碼從文字轉換語音服務串流的壓縮音訊。
所有程式設計語言：SpeechSynthesizer 現在支援三個新的原始輸出 Opus 格式（不含容器），這些格式在即時串流案例中廣泛使用。
JavaScript：已將 getVoicesAsync（） API 新增至 SpeechSynthesizer，以擷取支援的合成語音清單（GitHub 問題 1350）
JavaScript：已將 getWaveFormat（） API 新增至 AudioStreamFormat 以支援非 PCM 波格式（GitHub 問題 452）
JavaScript：已將磁碟區 getter/setter 和 mute（）/unmute（） API 新增至 SpeakerAudioDestination （GitHub 問題 463）

錯誤修正

C++、C#、Java、JavaScript、Objective-C 和 Swift：修正在停止使用 PushAudioInputStream 的語音辨識器時移除 10 秒的延遲。這是針對在呼叫 StopContinuousRecognition 之後未推送任何新音訊的情況（GitHub 問題 1318， 331）
Android 和 UWP 上的 Unity：已針對 UWP、Android ARM64 和 Windows 子系統 Android 版（WSA） ARM64 修正 Unity 元檔案（GitHub 問題 1360）
iOS：使用 CocoaPods 時在任何 iOS 裝置上編譯您的語音 SDK 應用程式現已修正（GitHub 問題 1320）
iOS：當 SpeechSynthesizer 設定為將音訊直接輸出至喇叭時，在極少數情況下，播放會停止。這是修正的。
JavaScript：如果找不到任何音訊工作程式，請使用腳本處理器後援進行麥克風輸入（GitHub 問題 455）
JavaScript：將通訊協定新增至代理程式以減輕 Sentry 整合發現的錯誤（GitHub 問題 465）

範例 GitHub

C++、 C#、 Python 和 Java 範例示範如何取得詳細的辨識結果。詳細數據包括替代辨識結果、信賴分數、語彙形式、標準化表單、遮罩正規化窗體，以及每個文字層級的計時。
使用AVFoundation作為外部音訊來源新增的iOS範例 。
已新增 Java 範例 ，示範如何使用 WordBoundary 事件取得 SRT （SubRip Text）格式。
發音評定的Android範例 。
C++， C# 顯示新診斷記錄類別的使用方式。

語音 SDK 1.19.0：2021-11 月版本

重點

說話者辨識服務現已正式推出（GA）。語音 SDK API 適用於 C++、C#、Java 和 JavaScript。使用說話者辨識，您可以藉由其獨特的語音特性準確驗證和識別說話者。如需此主題的詳細資訊，請參閱文件。
我們已搭配 Azure DevOps 和 GitHub 放棄對 Ubuntu 16.04 的支援。 Ubuntu 16.04 於 2021 年 4 月結束生命週期。將 Ubuntu 16.04 工作流程移轉至 Ubuntu 18.04 或更新的版本。
Linux 二進位檔中的OpenSSL連結已變更為動態。 Linux 二進位大小已減少約 50%。
已新增 Mac M1 ARM 型晶片支援。

新功能

C++/C#/Java：已新增新的 API，以啟用使用 Microsoft Audio Stack 進行語音輸入的音訊處理支援。文件在這裡。
C++：意圖辨識的新 API，有助於更進階的模式比對。這包括清單和預先建置的整數實體，以及將意圖和實體分組為模型的支援（檔、更新和範例正在開發中，並將於近期發佈）。
Mac：支援適用於 CocoaPod、Python、JAVA 和與 GitHub 問題 #1244 相關的 NuGet 套件的 Silicon ARM64 (M1) 晶片。
iOS/Mac：iOS 和 macOS 二進位檔現在已封裝成與 GitHub 問題 919 相關的 xcframework。
iOS/Mac：支援與 GitHub 問題 1171 相關的 Mac 催化劑。
Linux：針對 CentOS7 新增關於語音 SDK 的新 tar 套件。 Linux .tar套件現在包含中 lib/centos7-x64RHEL/CentOS 7 的特定連結庫。 lib/x64 中的語音 SDK 連結庫仍然適用於所有其他支援的 Linux x64 發行版（包括 RHEL/CentOS 8），且無法在 RHEL/CentOS 7 上運作。
JavaScript：VoiceProfile 和 SpeakerRecognizer API 使 async/awaitable。
JavaScript：針對美國政府 Azure 區域新增的支援。
Windows：在通用 Windows 平台上新增播放的支援（UWP）。

錯誤修正

Android：適用於 Android 套件的 OpenSSL 安全性更新（已更新為 1.1.1l 版）。
Python：已解決在 Python 上選取喇叭裝置失敗的 Bug。
核心：當聯機嘗試失敗時自動重新連線。
iOS：在 iOS 套件上停用音訊壓縮，因為使用 GStreamer 時發生不穩定和比特碼建置問題。詳細數據可透過 GitHub 問題 1209 取得。

範例 GitHub

Mac/iOS：已更新的範例和快速入門，以使用 xcframework 套件。
.NET：已更新為使用 .NET Core 3.1 版本的範例。
JavaScript：已新增語音助理的範例。

語音 SDK 1.18.0：2021-7 月版本

注意：從這裡開始使用語音 SDK。

醒目提示摘要

Ubuntu 16.04 於 2021 年 4 月終止生命週期。使用 Azure DevOps 和 GitHub，我們將於 2021 年 9 月中斷支援 16.04。將 Ubuntu 16.04 工作流程移轉至 Ubuntu 18.04 或更新的版本。

新功能

C++：與意圖辨識器的簡單語言模式比對現在可讓您更輕鬆地實作簡單的意圖辨識案例。
C++/C#/Java：我們已將新的 API 新增至 VoiceProfileClient 類別，GetActivationPhrasesAsync()以在獨立辨識案例的說話者辨識註冊階段中接收有效的啟用詞組清單。
- 重要事項：說話者辨識功能處於預覽狀態。在預覽版中建立的所有語音配置檔將在說話者辨識功能移出預覽版 90 天后停止。此時，預覽語音配置檔將會停止運作。
Python：已新增現有 SpeechRecognizer 和 TranslationRecognizer 對象上連續語言識別（LID）的支援。
Python：已新增名為 SourceLanguageRecognizer 的新 Python 物件，以執行一次性或連續 LID（不含辨識或翻譯）。
JavaScript： getActivationPhrasesAsync API 已新增至 VoiceProfileClient 類別，以在獨立辨識案例的說話者辨識註冊階段中接收有效的啟用片語清單。
JavaScriptVoiceProfileClient 的 enrollProfileAsync API 現在是可等候的異步。如需使用方式範例，請參閱此獨立識別程式碼。

改善

Java： 新增至許多 Java 物件的 AutoCloseable 支援。現在支援 try-with-resources 模型來釋放資源。請參閱此使用 try-with-resources 的範例。另請參閱 Oracle Java 文件教學課程，以瞭解此模式的 try-with-resources 語句。
許多平臺和架構的磁碟使用量 已大幅降低。二進位的 Microsoft.CognitiveServices.Speech.core 範例：x64 Linux 小於 475KB（減少 8.0%）：ARM64 Windows UWP 小於 464KB（減少 11.5%）：x86 Windows 小於 343KB（減少 17.5%）：和 x64 Windows 小於 451 KB（減少 19.4%）。

錯誤修正

Java：修正合成文字包含代理字元時的合成錯誤。這裡的詳細數據。
JavaScript：瀏覽器麥克風音訊處理現在會使用 AudioWorkletNode ，而不是已被取代 ScriptProcessorNode。這裡的詳細數據。
JavaScript：在長時間執行的對話轉譯案例中正確地讓交談保持運作。這裡的詳細數據。
JavaScript：已修正辨識器在連續辨識中重新連線到媒體流的問題。這裡的詳細數據。
JavaScript：已修正辨識器在連續辨識中重新連線至 pushStream 的問題。這裡的詳細數據。
JavaScript：在詳細的辨識結果中更正字級位移計算。這裡的詳細數據。

範例

這裡已更新 Java 快速入門範例。
已更新 JavaScript 說話者辨識範例，以顯示的新用法 enrollProfileAsync()。請參閱這裡的範例。

語音 SDK 1.17.0：2021-5 月版本

注意

在這裡開始使用語音 SDK。

醒目提示摘要

較小的使用量 - 我們會繼續減少語音 SDK 及其元件的記憶體和磁碟使用量。
新的獨立語言識別 API 可讓您辨識所說的語言。
使用 macOS 上的 Unity 開發已啟用語音的混合實境和遊戲應用程式。
除了語音辨識之外，您現在還可以使用來自 Go 程式設計語言的文字轉換語音。
幾個錯誤修正，以解決您，我們重視的客戶，已在 GitHub 上標幟的問題！謝謝！繼續提供意見反應！

新功能

C++/C#：透過 SourceLanguageRecognizer API 新增獨立「開始」和「連續語言偵測」。如果您只想要偵測音訊內容中說出的語言，這就是要執行的 API。請參閱 C++ 和 C# 的詳細數據。
C++/C#：語音辨識和翻譯辨識目前支援開始和連續語言識別，因此您可以在執行謄寫或翻譯之前，用程式設計的方式判斷語音使用的是哪種語言。如需語音辨識，請參閱這裡的檔，並在這裏參閱語音翻譯。
C#：已將支援 Unity 支援新增至 macOS （x64）。這會在混合實境和遊戲中解除鎖定語音辨識和語音合成使用案例！
Go：我們已新增語音合成文字轉換語音的支援至 Go 程式設計語言中，使語音合成能在更多使用案例中使用。請參閱我們的快速入門或參考檔。
C++/C#/Java/Python/Objective-C/Go：語音合成器現在支持 connection 物件。這可協助您管理和監視語音服務的連線，而且特別有助於預先連線以減少延遲。請參閱這裡的檔。
C++/C#/Java/Python/Objective-C/Go：我們現在公開的延遲和不足時間 SpeechSynthesisResult ，以協助您監視和診斷語音合成延遲問題。請參閱 C++、C#、Java、Python、Objective-C 和 Go 的詳細數據。
C++/C#/JAVA/Python/Objective-C：文字轉換語音在沒有指定使用語音下，預設使用神經語音。這可讓您依預設提供更高的精確度輸出，但也會增加默認價格。您可以指定超過 70 個標準語音或超過 130 個神經語音中的任何一個來變更預設值。
C++/C#/Java/Python/Objective-C/Go：我們在合成語音資訊中新增了 Gender 屬性，可讓您更輕鬆地根據性別選取語音。這解決了 GitHub 問題 #1055。
C++、C#、Java、JavaScript：我們現在支援 retrieveEnrollmentResultAsync、 getAuthorizationPhrasesAsync和，並在 getAllProfilesAsync() 說話者辨識中輕鬆管理指定帳戶的所有語音配置檔。請參閱 C++、C#、Java、JavaScript 的檔。這解決了 GitHub 問題 #338。
JavaScript：我們已新增連線失敗的重試，讓您的 JavaScript 語音應用程式更為穩固。

改善

Linux 和 Android 語音 SDK 二進位檔已更新為使用最新版本的 OpenSSL （1.1.1k）
程式代碼大小改善：
- Language Understanding 現在已分割成個別的 “lu” 連結庫。
- Windows x64 核心二進位大小減少 14.4%。
- Android ARM64 核心二進位大小減少 13.7%。
- 其他元件的大小也會減少。

錯誤修正

全部：已修正 ServiceTimeout 的 GitHub 問題 #842 。您現在可以使用語音 SDK 來謄寫長音訊檔案，無需擔心連線至服務因為此錯誤而終止。不過，我們仍然建議您針對長檔案使用批次轉譯。
C#：已修正 GitHub 問題 #947 ，其中沒有語音輸入可能會讓您的應用程式處於不良狀態。
Java：已修正 GitHub 問題 #997：使用 DialogService 時，適用於 Java 1.16 的語音 SDK 會當機連線或沒有網络連線或無效的訂用帳戶密鑰。
已修正突然停止語音辨識時的當機問題（例如，在控制台應用程式上使用 CTRL+C）。
Java：已新增修正程式，以在使用適用於 Java 的語音 SDK 時刪除 Windows 上的暫存盤。
Java：已修正 GitHub 問題 #994 ，其中呼叫 DialogServiceConnector.stopListeningAsync 可能會導致錯誤。
Java：已修正虛擬助理快速入門中的客戶問題。
JavaScript：已修正 GitHub 問題 #366，該問題為 ConversationTranslator 會顯示「this.cancelSpeech 不是函式」的錯誤。
JavaScript：已修正 GitHub 問題 #298 ，其中「以記憶體內部串流取得結果」範例會大聲播放。
JavaScript：已修正 GitHub 問題 #350 ，該問題為呼叫 AudioConfig 可能導致「ReferenceError：MediaStream 未定義」。
JavaScript：已修正長時間執行會話Node.js中的 UnhandledPromiseRejection 警告。

範例

在這裡更新macOS的 Unity 範例檔。
您現在可以在這裡找到 Azure AI 語音辨識服務的 React Native 範例。

語音 SDK 1.16.0：2021 年 3 月版本

注意

Windows 上的語音 SDK 取決於適用於 Visual Studio 2015、2017 和 2019 的共用 Microsoft C++ 可轉散發套件。在這裡下載。

新功能

C++/C#/Java/Python：已移至最新版的 GStreamer （1.18.3），以新增在 Windows、Linux 和 Android 上轉譯任何媒體格式的支援。請參閱這裡的檔。
C++/C#/Java/Objective-C/Python：已將壓縮 TTS/合成音訊譯碼的支援新增至 SDK。如果您將輸出音訊格式設定為 PCM 且 GStreamer 可在系統上使用，SDK 會自動要求服務的壓縮音訊，以節省頻寬，並將用戶端上的音訊譯碼。您可以將設定 SpeechServiceConnection_SynthEnableCompressedAudioTransmission 為 false 以停用此功能。 C++、C#、Java、Objective-C、Python 的詳細數據。
JavaScript:Node.js用戶現在 AudioConfig.fromWavFileInput 可以使用 API。這解決了 GitHub 問題 #252。
C++/C#/Java/Objective-C/Python：已新增 GetVoicesAsync() TTS 方法以傳回所有可用的合成語音。 C++、C#、Java、Objective-C 和 Python 的詳細數據。
C++/C#/Java/JavaScript/Objective-C/Python：新增 VisemeReceived TTS/語音合成的事件，以傳回同步 viseme 動畫。請參閱這裡的檔。
C++/C#/Java/JavaScript/Objective-C/Python：新增 BookmarkReached TTS 的事件。您可以在輸入 SSML 中設定書籤，並取得每個書籤的音訊位移。請參閱這裡的檔。
Java：已新增說話者辨識 API 的支援。這裡的詳細數據。
C++/C#/Java/JavaScript/Objective-C/Python：已新增兩個新的輸出音訊格式搭配 TTS 的 WebM 容器（Webm16Khz16BitMonoOpus 和 Webm24Khz16BitMonoOpus）。這些是使用 Opus 編解碼器串流音訊的更好格式。 C++、C#、Java、JavaScript、Objective-C、Python 的詳細數據。
C++/C#/Java：新增了擷取說話者辨識案例語音配置檔的支援。 C++、C# 和 Java 的詳細數據。
C++/C#/Java/Objective-C/Python：已新增音訊麥克風和喇叭控件個別共享連結庫的支援。這可讓開發人員在無需必要音訊程式庫相依性的環境中使用 SDK。
Objective-C/Swift：已新增對具有雨傘標頭之模組架構的支援。這可讓開發人員在 iOS/Mac Objective-C/Swift 應用程式中將語音 SDK 匯入為模組。這解決了 GitHub 問題 #452。
Python：已新增 Python 3.9 的支援，並針對 Python 3.5 針對 3.5 的 Python 終止生命週期已卸除支援。

已知問題

C++/C#/JAVA：DialogServiceConnector 無法使用 CustomCommandsConfig 存取自訂命令應用程式，且將會代替遇到連線錯誤。使用手動將應用程式標識元新增至要求 config.SetServiceProperty("X-CommandsAppId", "your-application-id", ServicePropertyChannel.UriQueryParameter)，即可解決此問題。的預期行為 CustomCommandsConfig 將在下一個版本中還原。

改善

為了減少語音 SDK 的記憶體使用量和磁碟使用量，Android 二進位檔現在要小 3% 到 5%。
改善我們的 C# 參考文件的正確性、可讀性，以及請參閱此處的章節。

錯誤修正

JavaScript：大型 WAV 檔案標頭現在已正確剖析（將標頭配量增加至 512 個字節）。這解決了 GitHub 問題 #962。
JavaScript：如果麥克風串流在停止辨識之前結束，則修正麥克風計時問題，解決語音辨識無法在 Firefox 中運作的問題。
JavaScript：現在，當瀏覽器在 turnOn 完成之前強制關閉麥克風時，我們現在正確地處理初始化承諾。
JavaScript：我們已將URL相依性取代為url-parse。這解決了 GitHub 問題 #264。
Android：已修正設定為 true 時 minifyEnabled 無法運作的回呼。
C++/C#/Java/Objective-C/Python： TCP_NODELAY 將正確設定為 TTS 的基礎套接字 IO，以減少延遲。
C++/C#/Java/Python/Objective-C/Go：修正辨識器在開始辨識後損毀時偶爾損毀的問題。
C++/C#/Java：已修正說話者辨識器解構時偶爾發生損毀的問題。

範例

JavaScript：瀏覽器範例不再需要個別的 JavaScript 連結庫檔案下載。

語音 SDK 1.15.0：2021 年 1 月版本

注意

Windows 上的語音 SDK 取決於 Visual Studio 2015、2017 和 2019 的共用 Microsoft C++ 可轉散發套件。在這裡下載。

醒目提示摘要

較小的記憶體和磁碟使用量可讓 SDK 更有效率。
適用於自定義神經語音私人預覽的更逼真度輸出格式。
意圖辨識器現在可以取得超過最上層意圖的傳回，讓您能夠對客戶的意圖進行個別的評量。
語音助理和 Bot 現在更容易設定，而且您可以立即停止接聽，並進一步控制其回應錯誤的方式。
透過選擇壓縮來改善裝置效能。
在 Windows ARM/ARM64 上使用語音 SDK。
改善低階偵錯。
發音評估功能現在已更廣泛地提供。
幾個錯誤修正，以解決您，我們重視的客戶，已在 GitHub 上標幟的問題！謝謝！繼續提供意見反應！

改善

語音 SDK 現在更有效率且輕量型。我們已開始進行多重發行工作，以減少語音 SDK 的記憶體使用量和磁碟使用量。作為第一個步驟，我們在大部分平臺上大幅減少共享連結庫的大小。與 1.14 版相比：
- 64 位 UWP 相容的 Windows 連結庫大約要小 30%。
- 32 位元 Windows 程式庫尚未有大小改善。
- Linux 連結庫較小 20-25%。
- Android 連結庫小 3-5%。

新功能

全部：提供新的 48KHz 輸出格式，可透過 TTS 語音合成 API 自訂神經語音的個人預覽：Audio48Khz192KBitRateMonoMp3、audio-48KHz-192kbitrate-mono-Mp3、Audio48Khz96KBitRateMonoMp3、audio-48KHz-96kbitrate-mono-Mp3、Raw48Khz16BitMonoPcm、raw-48KHz-16bit-mono-Pcm、Riff48Khz16BitMonoPcm、riff-48KHz-16bit-mono-pcm。
全部：自定義語音也更容易使用。已新增透過 #C++、C#、Java、JavaScript、Objective-C、Python 設定自定義語音EndpointId的支援。在此變更之前，自定義語音用戶必須透過 FromEndpoint 方法設定端點 URL。現在客戶可以使用 FromSubscription 方法，就像預先建置的語音一樣，然後藉由設定 EndpointId來提供部署標識符。這可簡化設定自定義語音。
C++/C#/Java/Objective-C/Python：取得超過最上層意圖的來源IntentRecognizer。它現在支援使用 verbose=true uri 參數，設定包含所有意圖的 JSON 結果，而不只是透過 LanguageUnderstandingModel FromEndpoint 方法的最高評分意圖。這解決了 GitHub 問題 #880。請參閱這裡的更新檔。
C++/C#/Java：讓您的語音助理或 Bot 立即停止接聽。 DialogServiceConnector （C++、 C#、 Java）現在有隨附 StopListeningAsync() 的方法 ListenOnceAsync()。這會立即停止音訊擷取並正常等候結果，使其非常適合用於「立即停止」按鈕按下案例。
C++/C#/Java/JavaScript：讓您的語音助理或 Bot 對基礎系統錯誤做出更好的反應。 DialogServiceConnector（C++、C#、Java、JavaScript）現在有新的TurnStatusReceived事件處理程式。這些選擇性事件會對應至 Bot 上的每 ITurnContext 一個解決方式，而且會在發生時回報回合執行失敗，例如，因為直接線路語音與 Bot 之間發生未處理的例外狀況、逾時或網路中斷。 TurnStatusReceived 可讓您更輕鬆地回應失敗狀況。例如，如果 Bot 在後端資料庫查詢上花費太長的時間（例如查閱產品）， TurnStatusReceived 可讓用戶端知道以「很抱歉，我不太明白，可以再試一次」或類似的內容。
C++/C#：在更多平臺上使用語音 SDK。語音 SDK NuGet 套件現在支援 Windows ARM/ARM64 桌面原生二進位檔（已支援 UWP），讓語音 SDK 在更多機器類型上更有用。
Java： DialogServiceConnector 現在有一個 setSpeechActivityTemplate() 不小心從先前的語言中排除的方法。這相當於設定屬性， Conversation_Speech_Activity_Template 並會要求 Direct Line Speech 服務產生的所有未來 Bot Framework 活動，將所提供的內容合併到其 JSON 承載中。
Java：改善低階偵錯。類別 Connection 現在有事件 MessageReceived ，類似於其他程序設計語言（C++、C#）。此事件提供從服務連入數據的低階存取，而且對於診斷和偵錯很有用。
JavaScript：透過輕鬆設定語音助理和 Bot BotFrameworkConfig，其現在具有 fromHost() 和 fromEndpoint() Factory 方法，可簡化使用自定義服務位置與手動設定屬性。我們也將的 botId 選擇性規格標準化，以跨組態處理站使用非預設 Bot。
JavaScript：透過新增 Websocket 壓縮的字串控制屬性，改善裝置效能。基於效能考慮，我們預設會停用websocket壓縮。這可以針對低頻寬案例重新啟用。這裡提供更多詳細資料。這解決了 GitHub 問題 #242。
JavaScript：已新增 lPronunciation Assessment 的支援，以啟用語音發音評估。請參閱這裡的快速入門。

錯誤修正

所有（JavaScript 除外）：已修正 1.14 版中的回歸，其中辨識器配置了太多記憶體。
C++：已修正的垃圾收集問題 DialogServiceConnector，解決 GitHub 問題 #794。
C#：修正線程關機的問題，導致對象在處置時封鎖約一秒。
C++/C#/Java：修正了應用程式在上多次設定語音授權令牌或活動範本的 DialogServiceConnector例外狀況。
C++/C#/Java：已修正因終止競爭條件而導致辨識器當機。
JavaScript：DialogServiceConnector先前未接受 's Factory 中指定的BotFrameworkConfig選擇性botId參數。如此一來，您必須手動設定 botId 查詢字串參數，以使用非預設 Bot。 Bug 已修正，且 botId 提供給 BotFrameworkConfig工廠的值將會受到認可及使用，包括新增 fromHost() 和 fromEndpoint() 新增專案。這也適用於 applicationId 的 CustomCommandsConfig參數。
JavaScript：已修正 GitHub 問題 #881，允許辨識器物件重複使用。
JavaScript：修正了 SKD 在一個 TTS 會話中多次傳送 speech.config 頻寬的問題。
JavaScript：簡化麥克風授權錯誤處理，在使用者未允許其瀏覽器上的麥克風輸入時，允許更多描述性訊息湧現。
JavaScript：已修正 GitHub 問題 #249 ，其中輸入錯誤 ConversationTranslator ，並 ConversationTranscriber 導致 TypeScript 使用者的編譯錯誤。
Objective-C：已修正 GStreamer 在 Xcode 11.4 上針對 iOS 建置失敗的問題，解決 GitHub 問題 #911。
Python：已修正 GitHub 問題 #870，移除 “DeprecationWarning：imp 模組已被取代，有利於 importlib”。

範例

JavaScript 瀏覽器的檔案範例現在會使用檔案進行語音辨識。這解決了 GitHub 問題 #884。

語音 SDK 1.14.0：2020-10 月版本

注意

Windows 上的語音 SDK 取決於適用於 Visual Studio 2015、2017 和 2019 的共用 Microsoft C++ 可轉散發套件。在這裡下載。

新功能

Linux：已新增Debian10和Ubuntu 20.04 LTS的支援。
Python/Objective-C：已新增 API KeywordRecognizer 的支援。檔將會在這裡。
C++/Java/C#：已新增支援，可透過 ServicePropertyChannel::HttpHeader設定任何HttpHeader索引鍵/值。
JavaScript：已新增 API ConversationTranscriber 的支援。請在這裡閱讀檔。
C++/C#：已新增 AudioDataStream FromWavFileInput 方法（若要讀取。WAV 檔案在這裡（C++）和這裡（C#）。
C++/C#/Java/Python/Objective-C/Swift：已新增 stopSpeakingAsync() 方法以停止文字到語音合成。在這裡閱讀參考檔（C++），這裡（C#），這裡（Java），這裡（Python），在這裡（Objective-C/Swift）。
C#、C++、Java：將函 FromDialogServiceConnector() 式新增至類別， Connection 可用來監視的 DialogServiceConnector連線和中斷連線事件。請在這裡閱讀參考檔（C#）、這裡（C++）和這裡（Java）。
C++/C#/Java/Python/Objective-C/Swift：新增了發音評估的支援，可評估語音發音，並提供演講者關於語音正確性和流暢性的意見反應。請閱讀此處的文件。

重大變更

JavaScript:P ullAudioOutputStream.read（）的傳回類型從內部 Promise 變更為原生 JavaScript Promise。

錯誤修正

全部：已修正 1.13 回歸， SetServiceProperty 其中會忽略具有特定特殊字元的值。
C#：修正 Visual Studio 2019 上找不到原生 DLL 的 Windows 控制台範例。
C#：修正當數據流作為 KeywordRecognizer 輸入時，記憶體管理當機的問題。
ObjectiveC/Swift：修正當數據流作為辨識器輸入時，記憶體管理的當機問題。
Windows：已修正 UWP 上的 BT HFP/A2DP 共存問題。
JavaScript：已修正會話標識碼的對應，以改善記錄並協助內部偵錯/服務相互關聯。
JavaScript：新增了在 DialogServiceConnector 進行第一次呼叫之後停用 ListenOnce 呼叫的修正。
JavaScript：已修正結果輸出只會是「簡單」的問題。
JavaScript：修正 macOS 上 Safari 中的連續辨識問題。
JavaScript：高要求輸送量案例的CPU負載風險降低。
JavaScript：允許存取語音配置文件註冊結果的詳細數據。
JavaScript：已在中新增連續辨識的 IntentRecognizer修正。
C++/C#/Java/Python/Swift/ObjectiveC：修正中 IntentRecognizer澳大利亞和巴西的 URL 不正確。
C++/C#：建立VoiceProfile物件時新增VoiceProfileType為自變數。
C++/C#/Java/Python/Swift/ObjectiveC：嘗試從指定位置讀取AudioDataStream時可能SPX_INVALID_ARG已修正。
IOS：已修正 Unity 上的語音辨識當機

範例

ObjectiveC：在這裡新增關鍵詞辨識的範例。
C#/JavaScript：在這裡新增交談轉譯的快速入門（C#）和這裡（JavaScript）。
C++/C#/Java/Python/Swift/ObjectiveC：在這裡新增發音評估的範例
Xamarin：已在這裏將快速入門更新為最新的 Visual Studio 範本。

已知問題

HoloLens 2 和 Android 4.4 （KitKat）預設不支援 DigiCert 全域根 G2 憑證，而且必須新增至系統，才能讓語音 SDK 運作。憑證將在近期內新增至 HoloLens 2 OS 映射。 Android 4.4 客戶必須將更新的憑證新增至系統。

COVID-19 簡略測試

由於在過去幾周內從遠端工作，我們無法執行與平常一樣多的手動驗證測試。我們尚未進行任何我們認為可能會中斷任何變更，而且我們的自動化測試全部通過。在我們錯過某些專案的可能性不大的情況下，請在 GitHub 上讓我們知道。
保持健康！

語音 SDK 1.13.0：2020-7 月版本

注意

Windows 上的語音 SDK 取決於 Visual Studio 2015、2017 和 2019 的共用 Microsoft C++ 可轉散發套件。請從這裡下載並安裝。

新功能

C#：已新增異步交談轉譯的支援。請參閱這裡的檔。
JavaScript：已新增瀏覽器和 Node.js的說話者辨識支援。
JavaScript：已新增語言識別/語言標識符的支援。請參閱這裡的檔。
Objective-C：已新增多裝置對話和對話謄寫支援。
Python：已在 Windows 和 Linux 上新增 Python 的壓縮音訊支援。請參閱這裡的檔。

錯誤修正

全部：已修正導致 KeywordRecognizer 在辨識之後無法向前行動數據流的問題。
全部：已修正導致從 KeywordRecognitionResult 取得的數據流不包含關鍵詞的問題。
全部：已修正 SendMessageAsync 在使用者完成等候時，不會真的在網路上傳送訊息的問題。
All：修正使用者呼叫 VoiceProfileClient：：SpeakerRecEnrollProfileAsync 方法多次且未等候通話完成時，說話者辨識 API 發生當機。
全部：已修正在 VoiceProfileClient 和 SpeakerRecognizer 類別中啟用檔案記錄功能。
JavaScript：已修正瀏覽器最小化時節流的問題。
JavaScript：已修正串流記憶體流失的問題。
JavaScript：已從 NodeJS 新增 OCSP 回應的快取。
Java：已修正導致 BigInteger 字段一律傳回 0 的問題。
iOS：已修正在 iOS App Store 中發布語音 SDK 型應用程式的問題。

範例

C++：在這裡新增說話者辨識的範例程序代碼。

COVID-19 簡略測試

語音 SDK 1.12.1：2020 年 6 月版本

新功能

C#、C++：說話者辨識預覽：這項功能可啟用說話者識別（誰說話？）和說話者驗證（他們聲稱是誰？）。從概觀開始，請閱讀說話者辨識基本概念一文或 API 參考檔。

錯誤修正

C#、C++：已修正說話者辨識 1.12 版本中，麥克風錄製無法運作的問題。
JavaScript：針對 Firefox，以及在 macOS 和 iOS 上 Safari 中的文字轉換語音進行修正。
修正使用八通道串流時，交談轉譯上的 Windows 應用程式驗證程式存取違規當機。
修正多重裝置對話翻譯上的 Windows 應用程式驗證程式存取違規當機。

範例

COVID-19 簡略測試

語音 SDK 1.12.0：2020-5 月版本

新功能

Go：語音辨識和自訂語音助理的新 Go 語言支援。在這裡設定您的開發環境。如需範例程式代碼，請參閱下面的範例一節。
JavaScript：已新增文字到語音轉換的瀏覽器支援。請參閱這裡的檔。
C++、C#、Java：Windows、Android、Linux 和 iOS 平台上支援的新 KeywordRecognizer 物件和 API。請閱讀此處的文件。如需範例程式代碼，請參閱下面的範例一節。
Java：已新增多裝置對話與翻譯支援。請參閱這裡的參考檔。

改善和優化

JavaScript：優化瀏覽器麥克風實作可改善語音辨識精確度。
Java：使用不含 SWIG 的直接 JNI 實作重構系結。這項變更會減少適用於 Windows、Android、Linux 和 Mac 之所有 Java 套件的系結大小 10 倍，並簡化語音 SDK Java 實作的進一步開發。
Linux：已使用最新的 RHEL 7 特定附註更新支援檔。
改善連線邏輯，以嘗試在發生服務和網路錯誤時多次連線。
已更新 portal.azure.com 語音快速入門頁面，協助開發人員在 Azure AI 語音旅程途中進行下一步驟。

錯誤修正

C#、Java：已修正在 Linux ARM 上載入 SDK 連結庫的問題（32 位和 64 位）。
C#：已修正 TranslationRecognizer、IntentRecognizer 和連線 ion 物件的原生句柄明確處置。
C#：已修正 ConversationTranscriber 物件的音訊輸入存留期管理。
已修正從樣本片語辨識意圖時，未正確設定 IntentRecognizer 結果原因的問題。
已修正未正確設定 SpeechRecognitionEventArgs 結果位移的問題。
已修正 SDK 在開啟 websocket 連線之前嘗試傳送網路訊息的競爭狀況。在新增參與者時可 TranslationRecognizer 重現。
已修正關鍵詞辨識器引擎中的記憶體流失。

範例

Go：新增語音辨識和自定義語音助理的快速入門。在這裡尋找範例程序代碼。
JavaScript：已新增文字轉換語音、翻譯和意圖辨識的快速入門。
C# 和 Java 的關鍵詞辨識範例（Android）。

COVID-19 簡略測試

由於在過去幾周內從遠端工作，我們無法執行與平常一樣多的手動驗證測試。我們尚未進行任何我們認為可能會中斷任何變更，而且我們的自動化測試全部通過。如果我們錯過了某些專案，請在 GitHub 上讓我們知道。
保持健康！

語音 SDK 1.11.0：2020 年 3 月版本

新功能

Linux：已新增 Red Hat Enterprise Linux （RHEL）/CentOS 7 x64 的支援，並說明如何為語音 SDK 設定系統。
Linux：已在 Linux ARM32 和 ARM64 上新增 .NET Core C# 的支援。您可以在這裡深入了解.
C#、C++：在中ConversationTranscriptionResult新增，在所有中繼和最終語音辨識結果中都一UtteranceId致標識符。 C#、C++ 的詳細數據。
Python：已新增對 Language ID的支援。請參閱 GitHub 存放庫中的speech_sample.py。
Windows：針對所有 win32 控制台應用程式，新增 Windows 平臺上的壓縮音訊輸入格式支援。這裡的詳細數據。
JavaScript：支援 NodeJS 中的語音合成 (文字轉換語音)。在這裡深入了解。
JavaScript：新增 API，以檢查所有傳送和接收的訊息。在這裡深入了解。

錯誤修正

C#、C++：已修正問題，因此 SendMessageAsync 現在會將二進位訊息傳送為二進位類型。 C#、C++ 的詳細數據。
C#、C++：修正在使用事件時，如果在 Recognizer 物件之前Connection處置，可能會Connection MessageReceived造成當機的問題。 C#、C++ 的詳細數據。
Android：麥克風的音訊緩衝區大小從 800 毫秒減少到 100 毫秒，以改善延遲。
Android：已修正 Android Studio 中 x86 Android 模擬器的問題。
JavaScript：已使用 fromSubscription API 新增對中國地區的支援。這裡的詳細數據。
JavaScript：從 NodeJS 新增連線失敗的更多錯誤資訊。

範例

Unity：意圖辨識公用範例已修正，其中 LUIS json 匯入失敗。這裡的詳細數據。
Python：針對新增的 Language ID範例。這裡的詳細數據。

Covid19 的簡略測試： 由於在過去幾周遠端工作，我們無法像往常一樣多地進行手動裝置驗證測試。例如，我們無法在 Linux、iOS 和 macOS 上測試麥克風輸入和喇叭輸出。我們尚未進行任何我們認為在這些平臺上可能會中斷任何變更，且我們的自動化測試全部通過。萬一我們遺漏了什麼，請在 GitHub 上告訴我們。
感謝您的持續支援。一如往常，請在 GitHub 或 Stack Overflow 上張貼問題或意見反應。
保持健康！

語音 SDK 1.10.0：2020 年 2 月版本

新功能

已新增 Python 套件以支援新的 3.8 版 Python。
Red Hat Enterprise Linux （RHEL）/CentOS 8 x64 支援（C++、C#、Java、Python）。

注意

客戶必須根據這些指示來設定 OpenSSL。
Debian 和 Ubuntu 的 Linux ARM32 支援。
DialogService 連線 or 現在支援 BotFrameworkConfig 上的選擇性 “bot ID” 參數。此參數可讓您使用多個 Direct Line Speech 聊天機器人搭配單一語音資源。若未指定參數，則會使用預設 Bot（由 Direct Line Speech 通道組態頁面決定）。
DialogService 連線 or 現在具有 SpeechActivityTemplate 屬性。 Direct Line Speech 將使用此 JSON 字串的內容，在到達 Direct Line Speech Bot 的所有活動中預先填入各種不同的支援欄位，包括自動產生以回應語音辨識等事件的活動。
TTS 現在會使用訂用帳戶密鑰進行驗證，以減少建立合成器之後第一個合成結果的第一個字節延遲。
已更新 19 個地區設定的語音辨識模型，以降低 18.6% 的平均單字錯誤率（es-ES， es-MX、fr-CA、fr-FR、it-IT、ja-JP、ko-KR、pt-BR、zh-CN、zh-HK、nb-NO、fi-FL、ru-RU、pl-PL、ca-ES、zh-TW、th-TH、pt-PT、tr-TR）。新的模型在多個領域帶來顯著的改善，包括聽寫、通話中心轉譯和影片索引案例。

錯誤修正

已修正對話 Transcriber 未在 JAVA API 中正確等候的錯誤
適用於 Xamarin GitHub 問題的 Android x86 模擬器修正
新增遺漏（Get|將 Property 方法設定為 AudioConfig
修正連線失敗時無法停止 audioDataStream 的 TTS 錯誤
使用沒有區域的端點會導致對話翻譯工具的 USP 失敗
通用 Windows 應用程式中的標識碼產生現在會使用適當唯一的 GUID 演算法;它先前和無意中預設為一個擷取的實作，通常會在大型互動集上產生衝突。

範例

搭配 Unity 麥克風和推播模式串流使用語音 SDK 的 Unity 範例

其他變更

已更新Linux的OpenSSL組態檔

語音 SDK 1.9.0：2020 年 1 月版本

新功能

多裝置交談：將多個裝置連線到相同的語音或文字型交談，並選擇性地翻譯在它們之間傳送的訊息。在本文中深入瞭解。
已新增 Android .aar 套件的關鍵詞辨識支援，並新增 x86 和 x64 類別的支援。
Objective-C： SendMessage 和 SetMessageProperty 方法已新增至 Connection 物件。請參閱這裡的檔。
TTS C++ API 現在支援 std::wstring 作為合成文字輸入，不需要先將 wstring 轉換成字串，再將它傳遞至 SDK。請參閱此處的詳細資料。
C#：語言標識碼和來源語言設定現已可供使用。
JavaScript：已將功能新增至 Connection 物件，以從語音服務傳遞自訂訊息作為回呼 receivedServiceMessage。
JavaScript：已新增 FromHost API 支援，以簡化內部部署容器和主權雲端的使用。請參閱這裡的檔。
JavaScript：我們現在感謝NODE_TLS_REJECT_UNAUTHORIZED長篇章的貢獻。請參閱此處的詳細資料。

重大變更

OpenSSL 已更新為 1.1.1b 版，並靜態連結至適用於 Linux 的語音 SDK 核心連結庫。如果您的信箱 OpenSSL 尚未安裝至系統的 /usr/lib/ssl 目錄，可能會造成中斷。參閱語音 SDK 文件中的我們的文件，以解決問題。
我們已將 C# WordLevelTimingResult.Offsetint 傳回的數據類型從變更為 long ，以允許在語音資料超過 2 分鐘時存取 WordLevelTimingResults 。
PushAudioInputStream 和 PullAudioInputStream 現在會根據 AudioStreamFormat，選擇性地在建立時指定 wav 標頭資訊給語音服務。客戶現在必須使用支援的音訊輸入格式。任何其他格式都會取得次佳的辨識結果，或可能會導致其他問題。

錯誤修正

請參閱上述重大 OpenSSL 變更底下的更新。我們已修正 Linux 和 Java 中的間歇性當機和效能問題（在高負載下鎖定爭用）。
Java：在高併行案例中改善物件關閉。
重新建構我們的 NuGet 套件。我們已移除 lib 資料夾下的和 Microsoft.CognitiveServices.Speech.extension.kws.dll 三個複本Microsoft.CognitiveServices.Speech.core.dll，讓 NuGet 套件更小、更快速地下載，並新增了編譯某些 C++ 原生應用程式所需的標頭。
已修正此處的快速入門範例。這些是在Linux、macOS、Windows上未顯示「找不到麥克風」例外狀況而結束的。
已修正 SDK 當機時，特定程式代碼路徑上的語音辨識結果很長，例如此範例。
已修正 Azure Web 應用程式環境中的 SDK 部署錯誤，以解決此客戶的問題。
已修正使用多重 <voice> 標記或標籤來 <audio> 解決此客戶問題的 TTS 錯誤。
修正 SDK 從暫停復原時發生 TTS 401 錯誤。
JavaScript：已修正由於來自 euirim 的貢獻，音訊數據的循環匯入。
JavaScript：新增了設定服務屬性的支援，如 1.7 中新增。
JavaScript：已修正連線錯誤可能會導致連續、失敗的 Websocket 重新連線嘗試的問題。

範例

在這裡新增Android的關鍵詞辨識範例。
在此新增伺服器案例的 TTS 範例。
在這裡新增 C# 和 C++ 的多裝置交談快速入門。

其他變更

Android 上優化的 SDK 核心連結庫大小。
1.9.0 和更新版本中的 SDK 支援交談 Transcriber 之語音簽章版本欄位中的 int 和 string 類型。

語音 SDK 1.8.0：2019-11 月版本

新功能

已新增 FromHost() API，以簡化內部部署容器和主權雲端的使用。
新增語音辨識的來源語言辨識（以 Java 和 C++ 為單位）
已新增 SourceLanguageConfig 語音辨識的物件，用來指定預期的來源語言（以 Java 和 C++ 為單位）
透過 NuGet 和 Unity 套件新增 KeywordRecognizer Windows （UWP）、Android 和 iOS 的支援
已新增遠端交談 Java API，以異步批次執行交談轉譯。

重大變更

對話 Transcriber 功能已移至命名空間 Microsoft.CognitiveServices.Speech.Transcription之下。
Conversation Transcriber 方法的部分會移至新 Conversation 類別。
已卸除對 32 位（ARMv7 和 x86） iOS 的支援

錯誤修正

修正在沒有有效語音服務訂用帳戶密鑰的情況下使用本機 KeywordRecognizer 時當機的問題

範例

的 Xamarin 範例 KeywordRecognizer
的 Unity 範例 KeywordRecognizer
自動來源語言識別的 C++ 和 Java 範例。

語音 SDK 1.7.0：2019-9 月版本

新功能

已在通用 Windows 平台（UWP）、Android 和 iOS 上新增 Xamarin 的 Beta 支援
已新增 Unity 的 iOS 支援
已在 Android、iOS 和 Linux 上新增 Compressed ALaw、Mulaw、FLAC 的輸入支援
在類別中Connection新增 SendMessageAsync ，以便將訊息傳送至服務
在類別中Connection新增 SetMessageProperty ，以設定訊息的屬性
TTS 新增 Java 的系結（JRE 和 Android）、Python、Swift 和 Objective-C
TTS 新增macOS、iOS和Android的播放支援。
已新增 TTS 的「字邊界」資訊。

錯誤修正

已修正 Android 版 Unity 2019 上的 IL2CPP 組建問題
已修正未正確處理 wav 檔案輸入中格式不正確的標頭問題
已修正某些連線屬性中 UUID 不是唯一的問題
已修正 Swift 系結中有關可為 Null 規範的一些警告（可能需要小型程式代碼變更）
已修正導致 Websocket 連線在網路負載下無法正常關閉的 Bug
已修正Android上有時會導致使用重複曝光標識符的問題 DialogServiceConnector
改善跨多回合互動的連線穩定性，以及在發生失敗時報告失敗（透過 Canceled 事件） DialogServiceConnector
DialogServiceConnector 會話開始現在會正確提供事件，包括在作用中期間呼叫 ListenOnceAsync() 時 StartKeywordRecognitionAsync()
解決與 DialogServiceConnector 收到活動相關聯的當機問題

範例

Xamarin 快速入門
已使用Linux ARM64資訊更新 CPP 快速入門
已使用 iOS 資訊更新 Unity 快速入門

語音 SDK 1.6.0：2019 年 6 月版本

範例

UWP 和 Unity 上文字到語音轉換的快速入門範例
iOS 上的 Swift 快速入門範例
語音和意圖辨識和翻譯的 Unity 範例
已更新的快速入門範例 DialogServiceConnector

改善/變更

對話框命名空間：
- SpeechBotConnector 已重新命名為 DialogServiceConnector
- BotConfig 已重新命名為 DialogServiceConfig
- BotConfig::FromChannelSecret() 已重新對應至 DialogServiceConfig::FromBotSecret()
- 重新命名之後，所有現有的 Direct Line Speech 用戶端都會繼續受到支援
更新 TTS REST 配接器以支援 Proxy 持續連線
在傳遞無效的區域時改善錯誤訊息
Swift/Objective-C：
- 改善的錯誤報告：可能導致錯誤的方法現在有兩個版本：一個公開 NSError 物件以處理錯誤，另一個會引發例外狀況。前者暴露在斯威夫特。這項變更需要適應現有的 Swift 程式代碼。
- 改善的事件處理

錯誤修正

修正 TTS： SpeakTextAsync 在音訊完成轉譯之前，未來會傳回，而不等到音訊完成轉譯
修正 C# 中封送處理字串以啟用完整語言支援
修正在範例中使用 net461 目標架構載入核心連結庫的 .NET Core 應用程式問題
修正將原生連結庫部署至範例中輸出資料夾的偶爾問題
可可靠地關閉 Web 套接字的修正
修正在Linux上開啟負載過重的連線時可能發生的當機問題
修正macOS架構套件組合中遺漏的元數據
修正 Windows 上的問題pip install --user

語音 SDK 1.5.1

這是 Bug 修正版本，只會影響原生/受控 SDK。這不會影響 SDK 的 JavaScript 版本。

錯誤修正

修正與交談轉譯搭配使用時的FromSubscription。
修正語音助理關鍵詞中的 Bug。

語音 SDK 1.5.0：2019-5 月版本

新功能

關鍵詞發現（KWS）現在適用於 Windows 和 Linux。 KWS 功能可能適用於任何麥克風類型、官方 KWS 支援，不過，目前僅限於 Azure Kinect DK 硬體或語音裝置 SDK 中找到的麥克風數位。
片語提示功能可透過 SDK 取得。如需詳細資訊，請參閱此處。
交談轉譯功能可透過 SDK 取得。
使用 Direct Line Speech 通道新增語音助理的支援。

範例

已新增 SDK 所支援新功能或新服務的範例。

改善/變更

已新增各種辨識器屬性來調整服務行為或服務結果（例如遮罩粗話和其他屬性）。
您現在可以透過標準組態屬性來設定辨識器，即使您已建立辨識器 FromEndpoint。
Objective-C： OutputFormat 屬性已新增至 SPXSpeechConfiguration。
SDK 現在支援 Debian 9 作為 Linux 發行版。

錯誤修正

修正了說話者資源在文字到語音轉換時太早解構的問題。

語音 SDK 1.4.2

這是 Bug 修正版本，只會影響原生/受控 SDK。這不會影響 SDK 的 JavaScript 版本。

語音 SDK 1.4.1

這是僅限 JavaScript 的版本。尚未新增任何功能。已進行下列修正：

防止 Web 套件載入 HTTPs-proxy-agent。

語音 SDK 1.4.0：2019 年 4 月版本

新功能

SDK 搶鮮版 (Beta) 目前支援文字轉換語音服務。從 C++ 和 C# 支援 Windows 和 Linux 桌面。如需詳細資訊，請參閱文字轉換語音概觀。
SDK 現在支援 MP3 和 Opus/OGG 音訊檔案作為資料流輸入檔。這項功能僅適用於來自 C++ 和 C# 的 Linux，目前為 Beta 版（如需詳細資訊，請參閱這裡）。
適用於 Java、.NET Core、C++ 和 Objective-C 的語音 SDK 已獲得 macOS 支援。 macOS 的 Objective-C 支援目前為 Beta 版。
iOS：適用於 iOS 的語音 SDK（Objective-C）現在也發佈為 CocoaPod。
JavaScript：支援非預設麥克風作為輸入設備。
JavaScript:Node.js的 Proxy 支援。

範例

已新增在macOS上使用語音 SDK 與 C++ 和 Objective-C 的範例。
已新增示範如何使用文字轉換語音服務的範例。

改善/變更

Python：辨識結果的其他屬性現在會透過 properties 屬性公開。
如需其他開發和偵錯支援，您可以將 SDK 記錄和診斷資訊重新導向至記錄檔（如需詳細資訊，請參閱這裡）。
JavaScript：改善音訊處理效能。

錯誤修正

Mac/iOS：修正無法建立語音服務連線時導致長時間等候的 Bug。
Python：改善 Python 回呼中自變數的錯誤處理。
JavaScript：已修正在 RequestSession 上結束之語音的錯誤狀態報告。

語音 SDK 1.3.1：2019 年 2 月重新整理

這是 Bug 修正版本，只會影響原生/受控 SDK。這不會影響 SDK 的 JavaScript 版本。

錯誤修正

已修正使用麥克風輸入時的記憶體流失。數據流型或檔案輸入不會受到影響。

語音 SDK 1.3.0：2019 年 2 月版本

新功能

語音 SDK 支援透過 AudioConfig 類別選取輸入麥克風。這可讓您從非預設麥克風將音訊數據串流至語音服務。如需詳細資訊，請參閱描述音訊輸入設備選取項目的檔。這項功能尚無法從 JavaScript 取得。
語音 SDK 現在支援 Beta 版本中的 Unity。透過 GitHub 範例存放庫中的問題區段提供意見反應。此版本支援 Windows x86 和 x64 上的 Unity（桌面或通用 Windows 平台應用程式），以及 Android（ARM32/64、x86）。如需詳細資訊，請參閱 Unity 快速入門。
Microsoft.CognitiveServices.Speech.csharp.bindings.dll 不再需要檔案（隨附於舊版）。此功能現在已整合至核心 SDK。

範例

我們的範例存放庫中提供下列新內容：

的其他範例 AudioConfig.FromMicrophoneInput。
用於意圖辨識和翻譯的其他 Python 範例。
在 iOS 中使用 Connection 物件的其他範例。
使用音訊輸出進行翻譯的其他 Java 範例。
使用批次轉譯 REST API 的新範例。

改善/變更

Python
- 改善中的 SpeechConfig參數驗證和錯誤訊息。
- 新增物件的支援 Connection 。
- 支援 Windows 上的 32 位 Python （x86）。
- 適用於 Python 的語音 SDK 已淘汰。
iOS
- SDK 現在已針對 iOS SDK 12.1 版建置。
- SDK 現在支援 iOS 9.2 版和更新版本。
- 改善參考檔並修正數個屬性名稱。
JavaScript
- 新增物件的支援 Connection 。
- 為配套的 JavaScript 新增類型定義檔案
- 片語提示的初始支持和實作。
- 使用服務 JSON 傳回屬性集合以進行辨識
Windows DLL 現在包含版本資源。
如果您建立辨識器 FromEndpoint，您可以直接將參數新增至端點 URL。您無法 FromEndpoint 透過標準組態屬性來設定辨識器。

錯誤修正

未正確處理空的 Proxy 用戶名稱和 Proxy 密碼。在此版本中，如果您將 Proxy 使用者名稱和 Proxy 密碼設定為空字串，系統將不會在連線到 Proxy 時提交出去。
SDK 所建立的 SessionId 不一定是某些語言/環境真正隨機的。已新增隨機產生器初始化，以修正此問題。
改善授權令牌的處理。如果您想要使用授權令牌，請在中 SpeechConfig 指定，並將訂用帳戶密鑰保留空白。然後像往常一樣建立辨識器。
在某些情況下， Connection 對象並未正確釋放。已修正此問題。
JavaScript 範例已修正，以支援 Safari 上轉譯合成的音訊輸出。

語音 SDK 1.2.1

這是僅限 JavaScript 的版本。尚未新增任何功能。已進行下列修正：

在 turn.end 引發數據流結尾，而不是在 speech.end。
修正音訊幫浦中的錯誤，如果目前的傳送失敗，則不會排程下一次傳送。
使用驗證令牌修正連續辨識。
針對不同的辨識器/端點修正錯誤。
檔改善。

語音 SDK 1.2.0：2018 年 12 月版本

新功能

Python
- 此版本提供 Python 支援的 Beta 版本（3.5 和更新版本）。如需詳細資訊，請參閱這裡]（.。/../quickstart-python.md）。
JavaScript
- 適用於 JavaScript 的語音 SDK 已開放原始碼。原始程式碼可在 GitHub 中取得。
- 我們現在支援Node.js，如需詳細資訊，請參閱這裡。
- 已移除音訊會話的長度限制，重新聯機會自動在封面下進行。
Connection 物件
- Recognizer您可以從存取 Connection 物件。此物件可讓您明確起始服務連線，並訂閱連線和中斷連線事件。（這項功能尚未從 JavaScript 和 Python 取得。
支援 Ubuntu 18.04。
Android
- 在 APK 產生期間啟用 ProGuard 支援。

改善

改善內部線程使用量，減少線程數目、鎖定、Mutex。
改善的錯誤報告/資訊。在有些情況下，錯誤訊息尚未完全傳播出去。
已更新 JavaScript 中的開發相依性，以使用最新的模組。

錯誤修正

已修正記憶體流失，因為中的 RecognizeAsync類型不符。
在某些情況下，例外狀況正在外洩。
修正轉譯事件自變數中的記憶體流失。
已修正長時間執行會話中重新連線的鎖定問題。
已修正可能導致失敗翻譯的最終結果遺失的問題。
C#：如果 async 主線程中未等候作業，則可能是在異步工作完成之前處置辨識器。
Java：已修正導致 Java VM 當機的問題。
Objective-C：固定列舉對應;已傳回 RecognizedIntent， RecognizingIntent而不是。
JavaScript：在中 SpeechConfig將默認輸出格式設定為 'simple'。
JavaScript：在 JavaScript 和其他語言的 config 物件上移除屬性之間的不一致。

範例

已更新並修正數個範例（例如翻譯的輸出語音等等）。
已在範例存放庫中新增Node.js範例。

語音 SDK 1.1.0

新功能

支援 Android x86/x64。
Proxy 支援：在物件中 SpeechConfig ，您現在可以呼叫函式來設定 Proxy 資訊（主機名、埠、使用者名稱和密碼）。此功能尚未在 iOS 上使用。
已改善錯誤碼和訊息。如果辨識傳回錯誤，則這已將 [已取消的事件] 或 CancellationDetails [辨識結果] 設定Reason為 Error。取消的事件現在包含兩個額外的成員， ErrorCode 與 ErrorDetails。如果伺服器傳回其他錯誤資訊，並顯示回報的錯誤，則新成員中現在可以使用它。

改善

已在辨識器組態中新增其他驗證，並新增其他錯誤訊息。
改善音訊檔案中長時間無聲的處理。
NuGet 套件：針對 .NET Framework 專案，它會防止使用 AnyCPU 組態進行建置。

錯誤修正

已修正辨識器中找到的數個例外狀況。此外，例外狀況會攔截並轉換成 Canceled 事件。
修正屬性管理中的記憶體流失。
已修正音訊輸入檔可能會當機辨識器的錯誤。
已修正在會話停止事件之後可以接收事件的 Bug。
已修正線程中的某些競爭條件。
已修正可能導致當機的 iOS 相容性問題。
Android 麥克風支持的穩定性改善。
已修正 JavaScript 中的辨識器會忽略辨識語言的錯誤。
修正了防止在 JavaScript 中設定 EndpointId （在某些情況下）的錯誤。
已變更 JavaScript 中 AddIntent 中的參數順序，並新增遺漏 AddIntent 的 JavaScript 簽章。

範例

已新增 C++ 和 C# 範例，以在範例存放庫中使用提取和推送數據流。

語音 SDK 1.0.1

可靠性改善和錯誤修正：

已修正因處置辨識器中的競爭狀況而導致的潛在嚴重錯誤
已修正未設定屬性發生時的潛在嚴重錯誤。
已新增其他錯誤和參數檢查。
Objective-C：已修正 NSString 中名稱覆寫所造成的可能嚴重錯誤。
Objective-C：已調整 API 可見性
JavaScript：已修正事件及其承載。
檔改善。

在我們的範例存放庫中，已新增JavaScript的新範例。

Azure AI 語音 SDK 1.0.0：2018 年 9 月版本

新功能

支援 iOS 上的 Objective-C。請參閱適用於 iOS 的 Objective-C 快速入門。
在瀏覽器中支援 JavaScript。請參閱我們的 JavaScript 快速入門。

重大變更

在此版本中，引進了許多重大變更。請查看此頁面以取得詳細數據。

Azure AI 語音 SDK 0.6.0：2018 年 8 月版本

新功能

使用語音 SDK 建置的 UWP 應用程式現在可以通過 Windows 應用程式認證套件（WACK）。請參閱 UWP 快速入門。
Linux 上的 .NET Standard 2.0 支援（Ubuntu 16.04 x64）。
實驗性：在 Windows 上支援 Java 8 （64 位）和 Linux （Ubuntu 16.04 x64）。請參閱 Java 執行時間環境快速入門。

功能變更

公開連線錯誤的其他錯誤詳細資訊。

重大變更

在 Java （Android）上，函 SpeechFactory.configureNativePlatformBindingWithDefaultCertificate 式不再需要路徑參數。現在，所有支援平台上都會自動偵測路徑。
已移除 Java 和 C# 中屬性 EndpointUrl 的 get-存取子。

錯誤修正

在 Java 中，現在會實作翻譯辨識器上的音訊合成結果。
已修正可能導致非使用中線程和開啟和未使用套接字數目增加的錯誤。
修正了長時間執行辨識可能會在傳輸中終止的問題。
已修正辨識器關機中的競爭條件。

Azure AI 語音 SDK 0.5.0：2018 年 7 月版本

新功能

支援 Android 平臺（API 23：Android 6.0 Marshmallow 或更高版本）。請參閱 Android 快速入門。
在 Windows 上支援 .NET Standard 2.0。請參閱 .NET Core 快速入門。
實驗性：支援 Windows 上的 UWP（版本 1709 或更新版本）。
- 請參閱 UWP 快速入門。
- 注意：使用語音 SDK 建置的 UWP 應用程式尚未通過 Windows 應用程式認證套件 (WACK) 的認證。
使用自動重新連線支援長時間執行的辨識。

功能變更

StartContinuousRecognitionAsync() 支援長時間執行的辨識。
辨識結果包含更多欄位。它們是從已辨識文字的音訊開始和持續時間（以刻度為單位）的位移，以及代表辨識狀態的其他值，例如 InitialSilenceTimeout 和 InitialBabbleTimeout。
支援 AuthorizationToken 來建立處理站實例。

重大變更

辨識事件： NoMatch 事件類型已合併至 Error 事件。
C# 中的 SpeechOutputFormat 已重新命名為 OutputFormat ，以保持與 C++ 保持一致。
介面某些方法的 AudioInputStream 傳回型別稍有變更：
- 在 Java 中，方法 read 現在會 long 傳回， int而不是。
- 在 C# 中 Read ，方法現在會 uint 傳回， int而不是。
- 在 C++ 中， Read 和 GetFormat 方法現在會傳回 size_t ， int而不是。
C++：音訊輸入資料流的實例現在只能傳遞為 shared_ptr。

錯誤修正

修正逾時時 RecognizeAsync() 的結果中不正確的傳回值。
已移除 Windows 上媒體基礎連結庫的相依性。 SDK 現在會使用核心音訊 API。
檔修正：已新增區域頁面來描述支持的區域。

已知問題

適用於 Android 的語音 SDK 不會報告翻譯的語音合成結果。下個版本將會修正此問題。

Azure AI 語音 SDK 0.4.0：2018 年 6 月版本

功能變更

AudioInputStream

辨識器現在可以取用數據流作為音訊來源。如需詳細資訊，請參閱相關的操作指南。
詳細的輸出格式

當您建立 SpeechRecognizer時，您可以要求 Detailed 或 Simple 輸出格式。 DetailedSpeechRecognitionResult包含信賴分數、辨識文字、原始語彙形式、正規化形式，以及具有遮罩粗話的正規化形式。

重大變更

從 C# 變更為 SpeechRecognitionResult.TextSpeechRecognitionResult.RecognizedText 。

錯誤修正

已修正在關機期間 USP 層中可能發生的回呼問題。
如果辨識器取用了音訊輸入檔案，則它所保存的檔案句柄超過必要時間。
拿掉訊息幫浦與辨識器之間的數個死結。
NoMatch在服務回應逾時時引發結果。
Windows 上的媒體基礎連結庫會延遲載入。只有麥克風輸入才需要此連結庫。
音訊數據的上傳速度限制為原始音訊速度的兩倍左右。
在 Windows 上，C# .NET 元件現在具有強名稱。
檔修正： Region 需要資訊才能建立辨識器。

已新增更多範例，並不斷更新。如需最新的範例集，請參閱語音 SDK 範例 GitHub 存放庫。

Azure AI 語音 SDK 0.2.12733：2018 年 5 月版本

此版本為 Azure AI 語音 SDK 的第一個公開預覽版本。

語音 CLI 1.37.0：2024 年 4 月版本

已更新為使用語音 SDK 1.37.0

新功能

none

錯誤修正

none

語音 CLI 1.36.0：2024 年 3 月版本

已更新為使用語音 SDK 1.36.0

新功能

none

錯誤修正

none

語音 CLI 1.35.0：2024 年 2 月版本

已更新為使用語音 SDK 1.35.0

新功能

none

錯誤修正

將 JMESPath 相依性更新為最新

語音 CLI 1.34.0：2023 年 11 月版本

已更新為使用語音 SDK 1.34.0

語音 CLI 1.33.0：2023 年 10 月版本

已更新為使用語音 SDK 1.34.0

語音 CLI 1.31.0：2023 年 8 月版本

已更新為使用語音 SDK 1.31.0

語音 CLI 1.30.0：2023 年 7 月版本

已更新為使用語音 SDK 1.30.0

語音 CLI 1.29.0：2023 年 6 月版本

已更新為使用語音 SDK 1.29.0

語音 CLI 1.28.0：2023 年 5 月版本

已更新為使用語音 SDK 1.28.0

語音 CLI 1.27.0：2023 年 4 月版本

更新

已更新為使用語音 SDK 1.27.0
更新預設端點，以針對自定義語音辨識和批次語音辨識使用 v3.1 REST API。

錯誤修正

與如何剖析/設定查詢參數相關的修正程式。

語音 CLI 1.26.0：2023 年 3 月版本

已更新為使用語音 SDK 1.26.0。

語音 CLI 1.25.0：2023 年 1 月版本

已更新為使用語音 SDK 1.25.0。

語音 CLI 1.24.0：2022 年 10 月版本

使用語音 SDK 1.24.0。

新功能

展開的「spx 檢查」，以支援所有spx事件的JMESPath查詢

錯誤修正

JMESPath 查詢評估的健全性各種改善
修正截斷在資源受限的計算機上可能發生的檔案寫入

語音 CLI 1.23.0：2022 年 7 月版本

使用語音 SDK 1.23.0。

新功能

更好的標題（--output vtt和--output srt）大型結果分割（37 個字元最大值， 3 行）
spx synthesize--format記載的選項（請參閱 spx help synthesize format）
已記載大部分 spx csr 命令/選項 (請參閱 spx help csr)
已新增 spx csr model copy 指令（請參閱 spx help csr model copy）
已使用 JMES 查詢新增 --check result 選項（請參閱 spx help check result）
已改善指定無效命令選項時的錯誤訊息
從 .NET Core 3.1 移至 .NET 6.0。若要執行語音 CLI，您必須安裝 .NET 6.0 執行階段 (或更新版本)。

錯誤修正

已更新所有 URL 以移除語言 (例如「en-US」)
已修正在所有情況下正確報告的版本資訊（先前有時顯示空白）

語音 CLI 1.22.0：2022 年 6 月版本

使用語音 SDK 1.22.0。

新功能

已新增 spx init 命令，引導使用者完成語音資源密鑰建立，而不需要前往 Azure 入口網站。
語音 Docker 容器現已包含 Azure CLI，因此 spx init 命令立即可用。
將時間戳新增為事件輸出選項，讓SPX在計算延遲時更有用。

語音 CLI 1.21.0：2022 年 4 月版本

使用語音 SDK 1.21.0。

新功能

WEBVTT標題產生
- 已將支援新增 --output vtt 至 spx translate
- 支援 --output vtt file FILENAME 覆寫預設 VTT FILENAME
- 支援 --output vtt file - 寫入標準輸出
- 系統會為每個目標語言建立個別 VTT 檔案 (例如 --target en;de;fr)
SRT 標題產生
- 已將支援新增 --output srt 至 spx recognize、 spx intent和 spx translate
- 支援 --output srt file FILENAME 覆寫預設 SRT FILENAME
- 支援 --output srt file - 寫入標準輸出
- 系統會針對 spx translate 為每個目標語言建立個別 SRT 檔案 (例如 --target en;de;fr)

錯誤修正

更正的 WEBVTT 時間範圍輸出以正確使用 hh:mm:ss.fff 格式

語音 CLI 1.20.0：2022 年 1 月版本

新功能

說話者辨識
- spx profile enroll 和 spx speaker [identify/verify] 現在支援麥克風輸入
意圖辨識（spx intent）
- --keyword FILE.table
- --pattern 和 --patterns
- --output all/each intentid
- --output all/each entity json
- --output all/each ENTITY entity
- --once、、 --once+--continuous （連續現在預設值）
- --output all/each connection EVENT
- --output all/each connection message（例如，， textpath）
CLI 控制台輸出預期檢查/撰寫：
- --expect PATTERN 和 --not expect PATTERN 在所有命令上支援
- --auto expect 協助撰寫預期的模式
SDK 記錄輸出預期檢查/撰寫
- --log expect PATTERN 和 --not log expect PATTERN 在所有命令上支援
- --log auto expect [FILTER] 支援所有命令
- --log FILE 支援 spx profile 和 spx speaker
音訊檔案輸入
- --format ANY 支援所有命令
- --file - 支援（從標準輸入讀取，啟用管道案例）
音訊檔案輸出
- --audio output - 寫入標準輸出，啟用管道案例
輸出檔案
- --output all/each file - 寫入標準輸出
- --output batch file - 寫入標準輸出
- --output vtt file - 寫入標準輸出
- --output json file - 寫入標準輸出，適用於 spx csr 和 spx batch 命令
輸出屬性
- --output […] result XXX property （PropertyId 或 string）
- --output […] connection message received XXX property （PropertyId 或 string）
- --output […] recognizer XXX property （PropertyId 或 string）
Azure WebJob 整合
- spx webjob 現在遵循子命令模式
- 已更新 WebJob 說明以反映子指令模式（請參閱 spx help webjob）

錯誤修正

已修正同時 --output vtt FILE 使用和 --output batch FILE 時的 Bug
spx [...] --zip ZIPFILENAME 現在包含所有案例所需的所有二進位檔（如果有的話）
spx profile 和 spx speaker 命令現在會傳回取消的詳細錯誤資訊

2021 年 5 月版本

新功能

已新增設定檔、說話者識別碼和說話者驗證的支援 - 請嘗試從命令行進行spx profilespx speaker。
我們也新增了對話框支援 - 從命令行試用 spx dialog 。
改善 spx 的說明。請開啟 GitHub 問題，提供我們關於其運作方式的意見反應。
我們已減少 .NET 工具安裝的大小。

COVID-19 簡略測試

隨著持續的大流行持續要求我們的工程師從家工作，預先大流行的手動驗證腳本已經大幅減少。我們會在設定較少的裝置上進行測試，以及可能會增加環境特定 Bug 的可能性。我們仍然會嚴格地使用一組大型自動化進行驗證。在我們錯過某些專案的可能性不大的情況下，請在 GitHub 上讓我們知道。
保持健康！

2021 年 3 月版本

新功能

新增意圖 spx intent 辨識的指令，並 spx recognize intent取代。
辨識和意圖現在可以使用 Azure 函式，使用 spx recognize --wer url <URL>來計算單字錯誤率。
辨識現在可以使用將結果輸出為 VTT 檔案 spx recognize --output vtt file <FILENAME>。
敏感性金鑰資訊現在會遮蔽在偵錯/詳細信息輸出中。
已新增批次轉譯建立中內容字段的 URL 檢查和錯誤訊息。

COVID-19 簡略測試

2021 年 1 月版本

新功能

語音 CLI 現在可作為 NuGet 套件使用，並可透過 .NET CLI 安裝為可從殼層/命令行呼叫的 .NET 全域工具。
自訂語音DevOps樣本存放庫已更新為使用語音 CLI 進行自訂語音工作流程。

COVID-19 簡略測試

2020 年 10 月版本

SPX 是無須撰寫程式碼的情況下，使用語音服務的命令列介面。在這裏下載最新版本。

新功能

spx csr dataset upload --kind audio|language|acoustic – 從本機數據建立數據集，而不只是從URL建立數據集。
spx csr evaluation create|status|list|update|delete – 比較新模型與基準真相/其他模型。
spx * list – 支援非分頁體驗（不需要 --top X --skip X）。
spx * --http header A=B – 支援自定義標頭（已針對 Office 新增以進行自定義驗證）。
spx help – 已改善文字和反向刻度文字色彩編碼（藍色）。

2020 年 6 月版本

已新增 CLI 內說明搜尋功能：
- spx help find --text TEXT
- spx help find --topic NAME
已更新以使用新部署的 v3.0 Batch 和自訂語音 API：
- spx help batch examples
- spx help csr examples

COVID-19 簡略測試

語音 CLI （也稱為 SPX）：2020 年 5 月版本

SPX 是新的命令行工具，可讓您從命令行執行辨識、合成、翻譯、批次轉譯和自定義語音管理。使用它來測試語音服務，或編寫您需要執行之語音服務工作的腳本。下載工具，並在這裡閱讀檔。

2024年4月版本

文字到語音轉換虛擬人偶

您現在可以為虛擬人偶設定靜態背景影像。若要使用這項功能，只需使用 avatarConfig.backgroundImage 屬性並指定指向所需影像的URL。如需解說，請參閱如何編輯背景。

2024 年 3 月版本

預先建置的神經語音

所有區域中en-US-AvaMultilingualNeural都有 9 個多語種語音：、、en-US-AndrewMultilingualNeural、、、、en-US-BrianMultilingualNeuralde-DE-FlorianMultilingualNeuralde-DE-SeraphinaMultilingualNeuralen-US-EmmaMultilingualNeural、、 fr-FR-RemyMultilingualNeuralfr-FR-VivienneMultilingualNeural和。zh-CN-XiaoxiaoMultilingualNeural 如需詳細資訊，請參閱完整的語言和語音清單。
推出新的多語種語音進行公開預覽： ja-JP-MasaruMultilingualNeural。如需詳細資訊，請參閱完整的語言和語音清單。
其他更新：
- en-US-RyanMultilingualNeural 已在所有區域中正式推出。
- en-US-JennyMultilingualV2Neural 已在所有區域中正式推出，與 en-US-JennyMultilingualNeural合併。
- 已更新 en-IN-NeerjaNeural 且 hi-IN-SwaraNeural 具有美國東部、西歐和東南亞3種新樣式的預覽版。
- 預覽適用於印度中部的新女性語音：en-IN-KavyaNeural、、en-IN-AnanyaNeuralen-IN-AashiNeural、hi-IN-KavyaNeural、和 hi-IN-AnanyaNeural。

文字到語音轉換虛擬人偶

已移除即時虛擬人偶 Azure 通訊服務（ACS） TURN 的相依性。範例程式代碼已據以更新，以反映這項變更。
已發佈文字至語音虛擬人偶定價。如需詳細資訊，請參閱定價頁面。請注意，只有提供此功能的服務區域才會顯示虛擬人偶定價，包括美國西部 2、西歐和東南亞。

2024年2月版本

OpenAI 語音

Azure AI 語音服務支援下列區域中的 OpenAI 文字到語音轉換：美國中北部和瑞典中部。如同 Azure AI 語音語音，OpenAI 文字到語音轉換會提供高品質的語音合成，以將書面文字轉換成自然語音語音。這可解除鎖定各種沉浸式和互動式用戶體驗的可能性。如需詳細資訊，請參閱什麼是OpenAI文字到語音轉換？。

注意

Azure OpenAI 服務也提供 OpenAI 文字到語音轉換語音。
透過此更新，我們已使用 Azure AI 語音來調整預先建置神經語音的價格。在這裡查看更新的定價。

個人語音

個人語音功能現在支援 DragonLatestNeural 和 PhoenixLatestNeural 模型。這些新模型增強了合成語音的自然性，更能與提示中語音的語音特性相同。如需詳細資訊，請參閱在應用程式中整合個人語音。

2023年12月版本

自訂語音 API

自訂語音 API 可用於建立和管理專業和個人自定義神經語音模型。

自定義神經語音

新定型的語音模型現在支援 48 kHz 取樣率，不論模型版本為何。針對先前定型的語音模型，必須將引擎版本升級至至少 2023.11.13.0 版本，以將取樣率提升至 48 kHz。

預先建置的神經語音

推出新的多語系語音以進行公開預覽：

地區設定 (BCP-47)	語言	文字轉換語音的語音
`de-DE`	德文 (德國)	`de-DE-FlorianMultilingualNeural` (男性)
`de-DE`	德文 (德國)	`de-DE-SeraphinaMultilingualNeural` (女性)
`en-US`	英文 (美國)	`en-US-AvaMultilingualNeural` (女性)
`en-US`	英文 (美國)	`en-US-EmmaMultilingualNeural` (女性)
`fr-FR`	法文 (法國)	`fr-FR-RemyMultilingualNeural` (男性)
`en-US`	英文 (美國)	`en-US-BrianMultilingualNeural` (男性)
`en-US`	英文 (美國)	`en-US-AndrewMultilingualNeural` (男性)
`fr-FR`	法文 (法國)	`fr-FR-VivienneMultilingualNeural` (女性)
`zh-CN`	中文 (國語，簡體)	`zh-CN-XiaoxiaoMultilingualNeural` (女性)
`zh-CN`	中文 (國語，簡體)	`zh-CN-XiaochenMultilingualNeural` (女性)
`zh-CN`	中文 (國語，簡體)	`zh-CN-YunyiMultilingualNeural` (男性)

推出新的 zh-CN-XiaoxiaoDialectsNeural 公開預覽語音，支持數個中文方言和口音：

Voicename	次要語言	方言/輔色
`zh-CN-XiaoxiaoDialectsNeural`	`zh-CN-shaanxi`	中文（中原普通話陝西，簡體）
	`zh-CN-sichuan`	中文（西南普通話，簡體）
	`zh-CN-shanxi`	中文（山西口音普通話，簡體）
	`nan-CN`	中文（南敏，簡體）
	`zh-CN-anhui`	中文（安徽江淮普通話，簡體）
	`zh-CN-hunan`	中文（湖南口音普通話，簡體）
	`zh-CN-gansu`	中文（甘肅蘭陰普通話，簡體）
	`zh-CN-shandong`	中文（吉魯普通話，簡體）
	`zh-CN-henan`	中文（中原普通話河南，簡體）
	`zh-CN-liaoning`	中文（東北普通話，簡體）
	`zh-TW`	中文（臺灣普通話，繁體中文）

2023年11月版本

個人語音

個人語音可在下列區域中預覽：西歐、美國東部和東南亞。使用個人語音（預覽版），您可以在幾秒鐘內取得 AI 產生的語音復寫（或應用程式的使用者）。您會提供一分鐘的語音範例做為音訊提示，然後使用它，以超過100個地區設定支援的任何90種語言產生語音。

如需詳細資訊，請參閱個人語音。

文字到語音轉換虛擬人偶

文字到語音轉換虛擬人偶可在下列區域中預覽：美國西部 2、西歐和東南亞。

文字到語音虛擬人偶會將文字轉換成相片現實人類的數位視訊（預先建置的虛擬人偶或自定義文字到語音虛擬人偶），以自然聲音說話。語音轉換虛擬人偶視訊的文字可以異步或即時合成。開發人員可以透過 API 建置與文字到語音虛擬人偶整合的應用程式，或使用 Speech Studio 上的內容建立工具來建立影片內容，而不需撰寫程式代碼。

如需詳細資訊，請參閱語音轉換虛擬人偶文字、透明度筆記，以及語音和虛擬人偶人才的披露。

自定義神經語音

已新增對跨語言語音的 24 個新地區設定支援。如需詳細資訊，請參閱完整語言清單。

預先建置的神經語音

公開預覽的新語音簡介：

地區設定 (BCP-47)	語言	文字轉換語音的語音
`de-DE`	德文 (德國)	`SeraphinaNeural` (女性)
`es-ES`	西班牙文 (西班牙)	`XimenaNeural` (女性)
`fr-CA`	法文 (加拿大)	`ThierryNeural` (男性)
`fr-FR`	法文 (法國)	`VivienneNeural` (女性)
`it-IT`	義大利文 (義大利)	`GiuseppeNeural` (男性)
`ko-KR`	韓文 (韓國)	`HyunsuNeural` (男性)
`pt-BR`	葡萄牙文 (巴西)	`ThalitaNeural` (女性)

已修正 Bug 和品質改進的模型：

地區設定 (BCP-47)	語言	文字轉換語音的語音
`es-ES`	西班牙文 (西班牙)	`AlvaroNeural` (男性)
`en-GB`	英文 (英國)	`RyanNeural` (男性)
`ko-KR`	韓文 (韓國)	`InjoonNeural` (男性)

如需詳細資訊，請參閱完整的語言和語音清單。

2023 年 10 月發行版本

自定義神經語音

已新增12個新地區設定與自訂神經語音 Pro的支援。如需詳細資訊，請參閱完整語言清單。

2023 年 9 月發行版本

預先建置的神經語音

公開預覽的新語音簡介：

地區設定 (BCP-47)	語言	文字轉換語音的語音
`en-US`	英文 (美國)	`en-US-EmmaNeural` (女性)
`en-US`	英文 (美國)	`en-US-AndrewNeural` (男性)
`en-US`	英文 (美國)	`en-US-BrianNeural` (男性)

如需詳細資訊，請參閱完整的語言和語音清單。

內嵌神經語音

這裡所有的 147 個地區設定（除了 fa-IR，波斯文（伊朗））都是現裝的，有 1 個選定的女性和/或 1 個選取的男性聲音。

2023 年 8 月版本

自定義神經語音

最新的 CNV Lite 訓練配方版本現已發行。此版本會為您的語言模型品質帶來數個增強功能。試用 Speech Studio。

2023 年 7 月發行版本

自定義神經語音

多樣式語音已正式推出。
在公開預覽中已新增兩個新的地區設定，適用於多樣式語音：ja-JP 和 zh-CN。如需詳細資訊，請參閱完整的語言和語音清單。請參閱不同語言的預設樣式清單。
跨語系語音已正式推出。
已新增兩個新的地區設定，適用於跨語言語音：id-ID 和 nl-NL。如需詳細資訊，請參閱完整的語言和語音清單。

預建的類神經 TTS 語音

介紹公開預覽的新 en-US 性別中性語音：

地區設定 (BCP-47)	語言	文字轉換語音的語音
`en-US`	英文 (美國)	`en-US-BlueNeural` (中性)

推出新的多語系語音以進行公開預覽：

地區設定 (BCP-47)	語言	文字轉換語音的語音
`en-US`	英文 (美國)	`en-US-JennyMultilingualV2Neural` (女性)
`en-US`	英文 (美國)	`en-US-RyanMultilingualNeural` (男性)

多語系語音 en-US-JennyMultilingualV2Neural 和 en-US-RyanMultilingualNeural 自動偵測輸入文字的語言。不過，您仍然可以使用 <lang> 元素來調整這些語音的說話語言。

這些新的多語系語音可以使用 41 種語言和口音：Arabic (Egypt)、Arabic (Saudi Arabia)、Catalan、Czech (Czechia)、Danish (Denmark)、German (Austria)、German (Switzerland)、German (Germany)、English (Australia)、English (Canada)、English (United Kingdom)、English (Hong Kong SAR)、English (Ireland)、English (India)、English (United States)、Spanish (Spain)、Spanish (Mexico)、Finnish (Finland)、French (Belgium)、French (Canada)、French (Switzerland)、French (France)、Hindi (India)、Hungarian (Hungary)、Indonesian (Indonesia)、Italian (Italy)、Japanese (Japan)、Korean (Korea)、Norwegian Bokmål (Norway)、Dutch (Belgium)、Dutch (Netherlands)、Polish (Poland)、Portuguese (Brazil)、Portuguese (Portugal)、Russian (Russia)、Swedish (Sweden)、Thai (Thailand)、Turkish (Türkiye)、Chinese (Mandarin, Simplified)、Chinese (Cantonese, Traditional)、Chinese (Taiwanese Mandarin, Traditional)。

這些多語系語音完全不支援某些 SSML 元素，例如中斷、強調、無聲和子。

重要

語音 en-US-JennyMultilingualV2Neural 會暫時在公開預覽中提供，以供評估之用。未來將予以移除。

為了以英文以外的語言說話，目前的 en-US-JennyMultilingualNeural 語音實作需要您設定 <lang xml:lang> 元素。我們預期在 2023 年第 4 季，en-US-JennyMultilingualNeural 語音將會更新為以沒有 <lang xml:lang> 元素的輸入文字語言說話。這會與 en-US-JennyMultilingualV2Neural 語音同位。

在公開預覽版中介紹下列語音的新功能：

已新增塞爾維亞文 (塞爾維亞) sr-RS 語音的拉丁輸入：sr-latn-RS-SophieNeural 和 sr-latn-RS-NicholasNeural。
已新增阿爾巴尼亞文 (阿爾巴尼亞) sq-AL 語音的英文發音支援：sq-AL-AnilaNeural 和 sq-AL-IlirNeural。

2023 年 5 月版本

音訊內容建立

所有具有說話樣式和多樣式自訂語音的預先建置語音都支援樣式度調整。
現在您可以藉由說出單字並錄製來修正單字的發音。音素可以從您的錄製自動辨識。辨識口語功能現在處於公開預覽狀態。

2023 年 4 月版本

預建的類神經 TTS 語音

這些語音的下列功能已從公開預覽移至 GA：

樣式	文字轉換語音的語音
style="chat"	`en-GB-RyanNeural`、`es-MX-JorgeNeural` 和 `it-IT-IsabellaNeural`
style="cheerful"	`en-GB-RyanNeural`、`en-GB-SoniaNeural`、`es-MX-JorgeNeural`、`fr-FR-DeniseNeural`、`fr-FR-HenriNeural` 和 `it-IT-IsabellaNeural`
style="sad"	`en-GB-SoniaNeural`、`fr-FR-DeniseNeural` 及 `fr-FR-HenriNeural`

改善 hi-IN 和 ta-IN 語音的 te-IN 英文發音，現在是在公開預覽區域中的發行小眾測試版

如需詳細資訊，請參閱語言和語音清單。

2023 年 3 月版本

新功能

語音合成標記語言（SSML）已更新，以支援音訊效果處理器元素，以針對裝置上的特定案例優化合成語音輸出的品質。在語音合成標記中深入瞭解。

自定義神經語音

已新增使用自定義神經語音 Pro 的地區設定支援nl-BE。如需詳細資訊，請參閱完整的語言和語音清單。

預建的類神經 TTS 語音

現在已正式推出下列語音。如需詳細資訊，請參閱完整的語言和語音清單。

地區設定 (BCP-47)	語言	文字轉換語音的語音
`en-AU`	英文 (澳大利亞)	`en-AU-AnnetteNeural` (女性) `en-AU-CarlyNeural` (女性) `en-AU-DarrenNeural` (男性) `en-AU-DuncanNeural` (男性) `en-AU-ElsieNeural` (女性) `en-AU-FreyaNeural` (女性) `en-AU-JoanneNeural` (女性) `en-AU-KenNeural` (男性) `en-AU-KimNeural` (女性) `en-AU-NeilNeural` (男性) `en-AU-TimNeural` (男性) `en-AU-TinaNeural` (女性) `en-AU-WilliamNeural` (男性)
`en-GB`	英文 (英國)	`en-GB-RyanNeural` (男性) `en-GB-SoniaNeural` (女性)
`es-ES`	西班牙文 (西班牙)	`es-ES-AbrilNeural` (女性) `es-ES-ArnauNeural` (男性) `es-ES-DarioNeural` (男性) `es-ES-EliasNeural` (男性) `es-ES-EstrellaNeural` (女性) `es-ES-IreneNeural` (女性) `es-ES-LaiaNeural` (女性) `es-ES-LiaNeural` (女性) `es-ES-NilNeural` (男性) `es-ES-SaulNeural` (男性) `es-ES-TeoNeural` (男性) `es-ES-TrianaNeural` (女性) `es-ES-VeraNeural` (女性)
`es-MX`	西班牙文 (墨西哥)	`es-MX-JorgeNeural` (男性)
`fr-FR`	法文 (法國)	`fr-FR-HenriNeural` (男性)
`it-IT`	義大利文 (義大利)	`it-IT-IsabellaNeural` (女性)
`ja-JP`	日文 (日本)	`ja-JP-AoiNeural` (女性) `ja-JP-DaichiNeural` (男性) `ja-JP-MayuNeural` (女性) `ja-JP-NaokiNeural` (男性) `ja-JP-ShioriNeural` (女性)

已新增使用 de-DE-ConradNeural 語音的 cheerful 樣式支援。

2023 年 2 月版本

預建的類神經 TTS 語音

現在已正式推出下列語音。如需詳細資訊，請參閱完整的語言和語音清單。

地區設定 (BCP-47)	語言	文字轉換語音的語音
`zh-CN`	中文 (國語，簡體)	`zh-CN-XiaomengNeural` (女性) `zh-CN-XiaoyiNeural` (女性) `zh-CN-XiaozhenNeural` (女性) `zh-CN-YunfengNeural` (男性) `zh-CN-YunhaoNeural` (男性) `zh-CN-YunjianNeural` (男性) `zh-CN-YunxiaNeural` (男性) `zh-CN-YunzeNeural` (男性)
`zh-CN-henan`	中文（中原普通話河南，簡體）	`zh-CN-henan-YundengNeural` (男性)

2022 年 12 月版本

批次合成 REST API (預覽)

批次合成 API 目前為公開預覽狀態。正式推出之後，長音訊 API 已被取代。如需詳細資訊，請參閱移轉至批次合成 API。

2022 年 11 月版本

預先建置的神經 TTS 語音（GA）

現在已正式推出下列語音。如需詳細資訊，請參閱完整的語言和語音清單。

地區設定 (BCP-47)	語言	文字轉換語音的語音
`es-MX`	西班牙文 (墨西哥)	`es-MX-BeatrizNeural` (女性) `es-MX-CandelaNeural` (女性) `es-MX-CarlotaNeural` (女性) `es-MX-CecilioNeural` (男性) `es-MX-GerardoNeural` (男性) `es-MX-LarissaNeural` (女性) `es-MX-LibertoNeural` (男性) `es-MX-LucianoNeural` (男性) `es-MX-MarinaNeural` (女性) `es-MX-NuriaNeural` (女性) `es-MX-PelayoNeural` (男性) `es-MX-RenataNeural` (女性) `es-MX-YagoNeural` (男性)
`it-IT`	義大利文 (義大利)	`it-IT-BenignoNeural` (男性) `it-IT-CalimeroNeural` (男性) `it-IT-CataldoNeural` (男性) `it-IT-FabiolaNeural` (女性) `it-IT-FiammaNeural` (女性) `it-IT-GianniNeural` (男性) `it-IT-ImeldaNeural` (女性) `it-IT-IrmaNeural` (女性) `it-IT-LisandroNeural` (男性) `it-IT-PalmiraNeural` (女性) `it-IT-PierinaNeural` (女性) `it-IT-RinaldoNeural` (男性)
`pt-BR`	葡萄牙文 (巴西)	`pt-BR-BrendaNeural` (女性) `pt-BR-DonatoNeural` (男性) `pt-BR-ElzaNeural` (女性) `pt-BR-FabioNeural` (男性) `pt-BR-GiovannaNeural` (女性) `pt-BR-HumbertoNeural` (男性) `pt-BR-JulioNeural` (男性) `pt-BR-LeilaNeural` (女性) `pt-BR-LeticiaNeural` (女性) `pt-BR-ManuelaNeural` (女性) `pt-BR-NicolauNeural` (男性) `pt-BR-ValerioNeural` (男性) `pt-BR-YaraNeural` (女性)

自定義神經語音

自定義神經語音會新增下列地區設定支援。如需詳細資訊，請參閱完整的語言和語音清單。

已新增使用自定義神經語音 Pro 的地區設定支援 fr-BE 。
已新增使用自定義神經語音精簡檔的地區設定支援 es-ES 。

2022 年 10 月版本

預先建置的神經 TTS 語音（GA）

現在已正式推出下列語音。如需詳細資訊，請參閱完整的語言和語音清單。

地區設定 (BCP-47)	語言	文字轉換語音的語音
`eu-ES`	巴斯克文	`eu-ES-AinhoaNeural` (女性) `eu-ES-AnderNeural` (男性)
`hy-AM`	亞美尼亞文 (亞美尼亞)	`hy-AM-AnahitNeural` (女性) `hy-AM-HaykNeural` (男性)

預先建置的神經 TTS 語音（預覽）

下列語音現在可在公開預覽中取得。如需詳細資訊，請參閱完整的語言和語音清單。

地區設定 (BCP-47)	語言	文字轉換語音的語音
`en-AU`	英文 (澳大利亞)	`en-AU-AnnetteNeural`（女） `en-AU-CarlyNeural`（女） `en-AU-DarrenNeural`（男） `en-AU-DuncanNeural`（男） `en-AU-ElsieNeural`（女） `en-AU-FreyaNeural`（女） `en-AU-JoanneNeural`（女） `en-AU-KenNeural`（男） `en-AU-KimNeural`（女） `en-AU-NeilNeural`（男） `en-AU-TimNeural`（男） `en-AU-TinaNeural`（女）
`es-ES`	西班牙文 (西班牙)	`es-ES-AbrilNeural`（女） `es-ES-AlvaroNeural`（男） `es-ES-ArnauNeural`（男） `es-ES-DarioNeural`（男） `es-ES-EliasNeural`（男） `es-ES-EstrellaNeural`（女） `es-ES-IreneNeural`（女） `es-ES-LaiaNeural`（女） `es-ES-LiaNeural`（女） `es-ES-NilNeural`（男） `es-ES-SaulNeural`（男） `es-ES-TeoNeural`（男） `es-ES-TrianaNeural`（女） `es-ES-VeraNeural`（女）
`ja-JP`	日文 (日本)	`ja-JP-AoiNeural`（女） `ja-JP-DaichiNeural`（男） `ja-JP-MayuNeural`（女） `ja-JP-NaokiNeural`（男） `ja-JP-ShioriNeural`（女）
`ko-KR`	韓文 (韓國)	`ko-KR-BongJinNeural`（男） `ko-KR-GookMinNeural`（男） `ko-KR-JiMinNeural`（女） `ko-KR-SeoHyeonNeural`（女） `ko-KR-SoonBokNeural`（女） `ko-KR-YuJinNeural`（女）
`wuu-CN`	中文（吳，簡體）	`wuu-CN-XiaotongNeural` (女性) `wuu-CN-YunzheNeural` (男性)
`yue-CN`	中文（粵語，簡體）	`yue-CN-XiaoMinNeural` (女性) `yue-CN-YunSongNeural` (男性)

一般 TTS 語音更新

改善和 fil-PH-BlessicaNeural 語音的品質fil-PH-AngeloNeural。
文字正規化規則是更新西班牙（智利）和uz-UZ烏茲別克（烏茲別克）地區設定的聲音es-CL。
增加了英文字母拼字， sq-AL 用於阿爾巴尼亞語（阿爾巴尼亞）和 az-AZ 亞塞拜然（亞塞拜然）地區設置。
改善語音的 zh-HK-WanLungNeural 英文發音。
改善了和 pt-BR-AntonioNeural 聲音的問題語調nl-NL-MaartenNeural。
已新增標記的支援<lang ="en-US">，以使用下列語音改善英文發音：de-DE-ConradNeural、、、fr-FR-DeniseNeurales-MX-DaliaNeurales-MX-JorgeNeurales-ES-AlvaroNeuralfr-CA-SylvieNeuralde-DE-KatjaNeural、fr-FR-HenriNeuralit-IT-DiegoNeural、和。it-IT-IsabellaNeural
新增具有下列語音的 style="chat" 標籤支援： en-GB-RyanNeural、 es-MX-JorgeNeural和 it-IT-IsabellaNeural。
新增具有下列語音的標籤支援：、、、、、fr-FR-HenriNeural和 it-IT-IsabellaNeuralfr-FR-DeniseNeurales-MX-JorgeNeuralen-GB-SoniaNeuralen-GB-RyanNeuralstyle="cheerful"
新增具有下列語音的標籤支援 style="sad" ： en-GB-SoniaNeural、 fr-FR-DeniseNeural 和 fr-FR-HenriNeural。

2022 年 9 月版本

預先建置的神經 TTS 語音

所有預先建置的神經語音都已升級為具有 48kHz 取樣率的高逼真度語音。

2022 年 8 月版本

預先建置的神經 TTS 語音

在公開預覽版中發行新的語音：

英文語音（美國）：en-US-AIGenerate1Neural和 en-US-AIGenerate2Neural。
適用於中文區域語言的語音：zh-CN-henan-YundengNeural、zh-CN-shaanxi-XiaoniNeural 和 zh-CN-shandong-YunxiangNeural。

如需詳細資訊，請參閱語言和語音清單。

2022 年 7 月版本

預先建置的神經 TTS 語音

在公開預覽版中新增了5zh-CN個新的中文（普通話、簡體）和1個新的英語語音en-US（美國）。請參閱完整的語言和語音清單。

語言	地區設定	性別	語音名稱	樣式支援
中文 (國語，簡體)	`zh-CN`	女性	`zh-CN-XiaomengNeural`^新增	使用 SSML 的一般、多個樣式
中文 (國語，簡體)	`zh-CN`	女性	`zh-CN-XiaoyiNeural`^新增	使用 SSML 的一般、多個樣式
中文 (國語，簡體)	`zh-CN`	女性	`zh-CN-XiaozhenNeural`^新增	使用 SSML 的一般、多個樣式
中文 (國語，簡體)	`zh-CN`	男性	`zh-CN-YunxiaNeural`^新增	使用 SSML 的一般、多個樣式
中文 (國語，簡體)	`zh-CN`	男性	`zh-CN-YunzeNeural`^新增	使用 SSML 的一般、多個樣式
英文 (美國)	`en-US`	男性	`en-US-RogerNeural`^新增	一般

新增神經語音的支持樣式和角色。

語音	樣式	樣式度	角色
zh-CN-曉門內公開 ^預覽	`chat`	支援
zh-CN-曉義內爾 ^公開預覽	`affectionate`、`angry`、`cheerful`、`disgruntled`、`embarrassed`、`fearful`、`gentle`、 `sadserious`	支援
zh-CN-曉珍內爾 ^公開預覽	`angry`、、`cheerfuldisgruntled`、`fearful`、、`sad`、`serious`	支援
zh-CN-YunxiaNeural ^公開預覽	`angry`、、 `calm`、 `cheerful`、 `fearful`、 `sad`	支援
zh-CN-YunzeNeural ^公開預覽	`angry`、`calm`、`cheerful`、`depressed`、`disgruntled`、`documentary-narration`、`fearful`、 `sadserious`	支援	支援

使用 viseme 取得臉部位置

已新增混合圖形的支援，以驅動您設計的 3D 字元臉部移動。深入瞭解如何使用viseme取得臉部位置。
SSML 已更新以支援viseme元素。請參閱語音合成標記。

2022 年 6 月版本

預先建置的神經 TTS 語音

已新增適用於類神經文字轉換語音的 9 種新語言和變體：

語言	地區設定	性別	語音名稱	樣式支援
阿拉伯文 (黎巴嫩)	`ar-LB`	女性	`ar-LB-LaylaNeural`^新增	一般
阿拉伯文 (黎巴嫩)	`ar-LB`	男性	`ar-LB-RamiNeural`^新增	一般
阿拉伯文 (阿曼)	`ar-OM`	女性	`ar-OM-AyshaNeural`^新增	一般
阿拉伯文 (阿曼)	`ar-OM`	男性	`ar-OM-AbdullahNeural`^新增	一般
亞塞拜然文 (亞塞拜然)	`az-AZ`	女性	`az-AZ-BabekNeural`^新增	一般
亞塞拜然文 (亞塞拜然)	`az-AZ`	男性	`az-AZ-BanuNeural`^新增	一般
波士尼亞（波士尼亞-黑塞哥維那）	`bs-BA`	女性	`bs-BA-VesnaNeural`^新增	一般
波士尼亞（波士尼亞-黑塞哥維那）	`bs-BA`	男性	`bs-BA-GoranNeural`^新增	一般
喬治亞文 (喬治亞)	`ka-GE`	女性	`ka-GE-EkaNeural`^新增	一般
喬治亞文 (喬治亞)	`ka-GE`	男性	`ka-GE-GiorgiNeural`^新增	一般
蒙古文 (蒙古)	`mn-MN`	女性	`mn-MN-YesuiNeural`^新增	一般
蒙古文 (蒙古)	`mn-MN`	男性	`mn-MN-BataaNeural`^新增	一般
尼泊爾文 (尼泊爾)	`ne-NP`	女性	`ne-NP-HemkalaNeural`^新增	一般
尼泊爾文 (尼泊爾)	`ne-NP`	男性	`ne-NP-SagarNeural`^新增	一般
阿爾巴尼亞文 (阿爾巴尼亞)	`sq-AL`	女性	`sq-AL-AnilaNeural`^新增	一般
阿爾巴尼亞文 (阿爾巴尼亞)	`sq-AL`	男性	`sq-AL-IlirNeural`^新增	一般
坦米爾文 (馬來西亞)	`ta-MY`	女性	`ta-MY-KaniNeural`^新增	一般
坦米爾文 (馬來西亞)	`ta-MY`	男性	`ta-MY-SuryaNeural`^新增	一般

GA 36 來自英國（英國）、fr-FR法國（法國）和de-DE德國（德國）公開預覽en-GB版的聲音：

語言	地區設定	性別	語音名稱	樣式支援
英文 (英國)	`en-GB`	女性	`en-GB-AbbiNeural`	一般
英文 (英國)	`en-GB`	女性	`en-GB-BellaNeural`	一般
英文 (英國)	`en-GB`	女性	`en-GB-HollieNeural`	一般
英文 (英國)	`en-GB`	女性	`en-GB-MaisieNeural`	一般，子語音
英文 (英國)	`en-GB`	女性	`en-GB-OliviaNeural`	一般
英文 (英國)	`en-GB`	女性	`en-GB-SoniaNeural`	一般
英文 (英國)	`en-GB`	男性	`en-GB-AlfieNeural`	一般
英文 (英國)	`en-GB`	男性	`en-GB-ElliotNeural`	一般
英文 (英國)	`en-GB`	男性	`en-GB-EthanNeural`	一般
英文 (英國)	`en-GB`	男性	`en-GB-NoahNeural`	一般
英文 (英國)	`en-GB`	男性	`en-GB-OliverNeural`	一般
英文 (英國)	`en-GB`	男性	`en-GB-ThomasNeural`	一般
法文 (法國)	`fr-FR`	女性	`fr-FR-BrigitteNeural`	一般
法文 (法國)	`fr-FR`	女性	`fr-FR-CelesteNeural`	一般
法文 (法國)	`fr-FR`	女性	`fr-FR-CoralieNeural`	一般
法文 (法國)	`fr-FR`	女性	`fr-FR-EloiseNeural`	一般，子語音
法文 (法國)	`fr-FR`	女性	`fr-FR-JacquelineNeural`	一般
法文 (法國)	`fr-FR`	女性	`fr-FR-JosephineNeural`	一般
法文 (法國)	`fr-FR`	女性	`fr-FR-YvetteNeural`	一般
法文 (法國)	`fr-FR`	男性	`fr-FR-AlainNeural`	一般
法文 (法國)	`fr-FR`	男性	`fr-FR-ClaudeNeural`	一般
法文 (法國)	`fr-FR`	男性	`fr-FR-JeromeNeural`	一般
法文 (法國)	`fr-FR`	男性	`fr-FR-MauriceNeural`	一般
法文 (法國)	`fr-FR`	男性	`fr-FR-YvesNeural`	一般
德文 (德國)	`de-DE`	女性	`de-DE-AmalaNeural`	一般
德文 (德國)	`de-DE`	女性	`de-DE-ElkeNeural`	一般
德文 (德國)	`de-DE`	女性	`de-DE-GiselaNeural`	一般，子語音
德文 (德國)	`de-DE`	女性	`de-DE-KlarissaNeural`	一般
德文 (德國)	`de-DE`	女性	`de-DE-LouisaNeural`	一般
德文 (德國)	`de-DE`	女性	`de-DE-MajaNeural`	一般
德文 (德國)	`de-DE`	女性	`de-DE-TanjaNeural`	一般
德文 (德國)	`de-DE`	男性	`de-DE-BerndNeural`	一般
德文 (德國)	`de-DE`	男性	`de-DE-ChristophNeural`	一般
德文 (德國)	`de-DE`	男性	`de-DE-KasperNeural`	一般
德文 (德國)	`de-DE`	男性	`de-DE-KillianNeural`	一般
德文 (德國)	`de-DE`	男性	`de-DE-KlausNeural`	一般
德文 (德國)	`de-DE`	男性	`de-DE-RalfNeural`	一般

在公開預覽版中新增了40種 es-MX 西班牙文（墨西哥）、 it-IT 義大利語（義大利）、 pt-BR 葡萄牙文（巴西）和2種中文（普通話、簡體）口音 zh-CN ：

語言	地區設定	性別	語音名稱	樣式支援
西班牙文 (墨西哥)	`es-MX`	女性	`es-MX-BeatrizNeural`^新增	一般
西班牙文 (墨西哥)	`es-MX`	女性	`es-MX-CarlotaNeural`^新增	一般
西班牙文 (墨西哥)	`es-MX`	女性	`es-MX-NuriaNeural`^新增	一般
西班牙文 (墨西哥)	`es-MX`	女性	`es-MX-RenataNeural`^新增	一般
西班牙文 (墨西哥)	`es-MX`	女性	`es-MX-LarissaNeural`^新增	一般
西班牙文 (墨西哥)	`es-MX`	女性	`es-MX-CandelaNeural`^新增	一般
西班牙文 (墨西哥)	`es-MX`	女性	`es-MX-MarinaNeural`^新增	一般
義大利文 (義大利)	`it-IT`	女性	`it-IT-FiammaNeural`^新增	一般
義大利文 (義大利)	`it-IT`	女性	`it-IT-IrmaNeural`^新增	一般
義大利文 (義大利)	`it-IT`	女性	`it-IT-FabiolaNeural`^新增	一般
義大利文 (義大利)	`it-IT`	女性	`it-IT-PalmiraNeural`^新增	一般
義大利文 (義大利)	`it-IT`	女性	`it-IT-ImeldaNeural`^新增	一般
義大利文 (義大利)	`it-IT`	女性	`it-IT-PierinaNeural`^新增	一般
葡萄牙文 (巴西)	`pt-BR`	女性	`pt-BR-ElzaNeural`^新增	一般
葡萄牙文 (巴西)	`pt-BR`	女性	`pt-BR-ManuelaNeural`^新增	一般
葡萄牙文 (巴西)	`pt-BR`	女性	`pt-BR-BrendaNeural`^新增	一般
葡萄牙文 (巴西)	`pt-BR`	女性	`pt-BR-LeilaNeural`^新增	一般
葡萄牙文 (巴西)	`pt-BR`	女性	`pt-BR-YaraNeural`^新增	一般
葡萄牙文 (巴西)	`pt-BR`	女性	`pt-BR-GiovannaNeural`^新增	一般
葡萄牙文 (巴西)	`pt-BR`	女性	`pt-BR-LeticiaNeural`^新增	一般
西班牙文 (墨西哥)	`es-MX`	男性	`es-MX-CecilioNeural`^新增	一般
西班牙文 (墨西哥)	`es-MX`	男性	`es-MX-LibertoNeural`^新增	一般
西班牙文 (墨西哥)	`es-MX`	男性	`es-MX-LucianoNeural`^新增	一般
西班牙文 (墨西哥)	`es-MX`	男性	`es-MX-PelayoNeural`^新增	一般
西班牙文 (墨西哥)	`es-MX`	男性	`es-MX-YagoNeural`^新增	一般
西班牙文 (墨西哥)	`es-MX`	男性	`es-MX-GerardoNeural`^新增	一般
義大利文 (義大利)	`it-IT`	男性	`it-IT-BenignoNeural`^新增	一般
義大利文 (義大利)	`it-IT`	男性	`it-IT-CataldoNeural`^新增	一般
義大利文 (義大利)	`it-IT`	男性	`it-IT-LisandroNeural`^新增	一般
義大利文 (義大利)	`it-IT`	男性	`it-IT-CalimeroNeural`^新增	一般
義大利文 (義大利)	`it-IT`	男性	`it-IT-RinaldoNeural`^新增	一般
義大利文 (義大利)	`it-IT`	男性	`it-IT-GianniNeural`^新增	一般
葡萄牙文 (巴西)	`pt-BR`	男性	`pt-BR-DonatoNeural`^新增	一般
葡萄牙文 (巴西)	`pt-BR`	男性	`pt-BR-HumbertoNeural`^新增	一般
葡萄牙文 (巴西)	`pt-BR`	男性	`pt-BR-FabioNeural`^新增	一般
葡萄牙文 (巴西)	`pt-BR`	男性	`pt-BR-JulioNeural`^新增	一般
葡萄牙文 (巴西)	`pt-BR`	男性	`pt-BR-ValerioNeural`^新增	一般
葡萄牙文 (巴西)	`pt-BR`	男性	`pt-BR-NicolauNeural`^新增	一般
中文 (國語，簡體)	`zh-CN-sichuan`	男性	`zh-CN-sichuan-YunxiSichuanNeural`^新增	一般，四川口音
中文 (國語，簡體)	`zh-CN-liaoning`	女性	`zh-CN-liaoning-XiaobeiNeural`^新增	一般，遼寧口音

改善和的品質en-SG-LunaNeuralen-SG-WayneNeural
具有 en-US-JennyNeural、en-US-AriaNeural 和 zh-CN-XiaoxiaoNeural 的公開預覽 48kHz 輸出支援

自定義神經語音

已啟用以在線修正數據問題。深入瞭解如何在Speech Studio中解決數據問題。
已新增訓練配方版本。深入瞭解如何為您的語音模型選取定型配方版本。

音訊內容建立工具

支援的分頁。
啟用以全域方式排序工作檔案頁面上的名稱、檔類型和更新時間。

2022 年 5 月版本

預先建置的神經 TTS 語音

以多種風格在公開預覽版中發行了5個新聲音，以豐富美式的多樣性。請參閱完整的語言和語音清單。
支援這些新樣式Angry、Excited、FriendlySadShoutingHopeful、、、 UnfriendlyTerrified 和 Whispering 公開預覽。en-US-AriaNeural
支援、、、 Terrified 與公開預覽en-US-JennyNeuralen-US-GuyNeural版中的這些新樣式。UnfriendlyWhisperingShoutingSadHopefulExcitedFriendlyCheerfulAngry
支援這些新樣式Excited、Friendly、、Hopeful、Shouting、 TerrifiedUnfriendly和 Whispering 公開預覽en-US-SaraNeural。請參閱語音樣式和角色。
在公開預覽中發行新的語音 zh-CN-YunjianNeural、 zh-CN-YunhaoNeural和 zh-CN-YunfengNeural 。請參閱完整的語言和語音清單。
支援 2 個新樣式sports-commentary，sports-commentary-excited在公開預覽中。zh-CN-YunjianNeural 請參閱語音樣式和角色。
在公開預覽zh-CN-YunhaoNeural中支援 1 個新樣式advertisement-upbeat。請參閱語音樣式和角色。
的所有 cheerful 區域都已正式推出和 sadfr-FR-DeniseNeural 樣式。
SSML 已更新為支援 en-US 和 en-AU 語音的 MathML 元素。在語音合成標記中深入瞭解。

自定義神經語音

啟用以取消定型語音模型期間的定型。深入瞭解如何取消訓練。
已啟用複製模型（重新命名語音模型）。深入瞭解如何重新命名您的語音模型。
啟用可藉由新增您自己的測試腳本來測試您的語音模型。深入瞭解如何上傳測試腳本。
已啟用以更新語音模型的引擎版本。深入瞭解如何更新模型引擎版本。
支援更多訓練區域。請參閱區域支援。
支援自定義神經語音精簡版的10個地區設定（預覽）。請參閱語言支援。

音訊內容建立工具

啟用即可在未登入的情況下試用音訊內容建立工具。
已改善調整音素的配置。
增強效能：指定一次上傳的檔案數目上限（200）。
增強效能：指定目錄深度層級上限（5 個層級）。

2022 年 3 月版本

預先建置的神經 TTS 語音

已使用 fr-FR-DeniseNeural新增公開預覽CheerfulSad和樣式的支援。請參閱語音樣式和角色。
已發行已中斷連線的容器，以供公開預覽中預先建置的神經 TTS 語音使用。請參閱在中斷連線的環境中使用 Docker 容器。

自定義神經語音

支援的角色型訪問控制。深入瞭解 Speech Studio中的 Azure 角色型訪問控制
支援的私人端點和虛擬網路服務端點。深入瞭解如何搭配語音服務使用私人端點。

音訊內容建立工具

已更新免費層（F0）資源的檔案大小和並行限制，讓體驗與語音 SDK 和 API 一致。請參閱語音服務配額和限制。

2022 年 2 月版本

自定義神經語音

在公開預覽版中發行自定義神經語音精簡檔。深入了解什麼是自定義神經語音精簡檔。
延伸語言支援至 49 個地區設定。請參閱語言支援。
支援更多區域/數據中心。請參閱區域支援。

音訊內容建立工具

已移除下載音訊的輸出長度限制。

2022 年 1 月版本

新語言和聲音

已新增適用於類神經文字轉換語音的 10 種新語言和變體：

語言	地區設定	性別	語音名稱	樣式支援
孟加拉文 (印度)	`bn-IN`	女性	`bn-IN-TanishaaNeural`^新增	一般
孟加拉文 (印度)	`bn-IN`	男性	`bn-IN-BashkarNeural`^新增	一般
冰島文 (冰島)	`is-IS`	女性	`is-IS-GudrunNeural`^新增	一般
冰島文 (冰島)	`is-IS`	男性	`is-IS-GunnarNeural`^新增	一般
坎那達文 (印度)	`kn-IN`	女性	`kn-IN-SapnaNeural`^新增	一般
坎那達文 (印度)	`kn-IN`	男性	`kn-IN-GaganNeural`^新增	一般
哈薩克文 (哈薩克)	`kk-KZ`	女性	`kk-KZ-AigulNeural`^新增	一般
哈薩克文 (哈薩克)	`kk-KZ`	男性	`kk-KZ-DauletNeural`^新增	一般
寮文 (寮國)	`lo-LA`	女性	`lo-LA-KeomanyNeural`^新增	一般
寮文 (寮國)	`lo-LA`	男性	`lo-LA-ChanthavongNeural`^新增	一般
馬其頓文 (北馬其頓共和國)	`mk-MK`	女性	`mk-MK-MarijaNeural`^新增	一般
馬其頓文 (北馬其頓共和國)	`mk-MK`	男性	`mk-MK-AleksandarNeural`^新增	一般
馬來亞拉姆文 (印度)	`ml-IN`	女性	`ml-IN-SobhanaNeural`^新增	一般
馬來亞拉姆文 (印度)	`ml-IN`	男性	`ml-IN-MidhunNeural`^新增	一般
普什圖文 (阿富汗)	`ps-AF`	女性	`ps-AF-LatifaNeural`^新增	一般
普什圖文 (阿富汗)	`ps-AF`	男性	`ps-AF-GulNawazNeural`^新增	一般
塞爾維亞文 (塞爾維亞，斯拉夫)	`sr-RS`	女性	`sr-RS-SophieNeural`^新增	一般
塞爾維亞文 (塞爾維亞，斯拉夫)	`sr-RS`	男性	`sr-RS-NicholasNeural`^新增	一般
僧伽羅文 (斯里蘭卡)	`si-LK`	女性	`si-LK-ThiliniNeural`^新增	一般
僧伽羅文 (斯里蘭卡)	`si-LK`	男性	`si-LK-SameeraNeural`^新增	一般

如需可用語音的完整清單，請參閱語言支援。

預覽中的新語音

已在預覽版中新增 en-GB、fr-FR 和 de-DE 的語音：

語言	地區設定	性別	語音名稱	樣式支援
英文 (英國)	`en-GB`	女性	`en-GB-AbbiNeural`^新增	一般
英文 (英國)	`en-GB`	女性	`en-GB-BellaNeural`^新增	一般
英文 (英國)	`en-GB`	女性	`en-GB-HollieNeural`^新增	一般
英文 (英國)	`en-GB`	女性	`en-GB-OliviaNeural`^新增	一般
英文 (英國)	`en-GB`	女孩	`en-GB-MaisieNeural`^新增	一般
英文 (英國)	`en-GB`	男性	`en-GB-AlfieNeural`^新增	一般
英文 (英國)	`en-GB`	男性	`en-GB-ElliotNeural`^新增	一般
英文 (英國)	`en-GB`	男性	`en-GB-EthanNeural`^新增	一般
英文 (英國)	`en-GB`	男性	`en-GB-NoahNeural`^新增	一般
英文 (英國)	`en-GB`	男性	`en-GB-OliverNeural`^新增	一般
英文 (英國)	`en-GB`	男性	`en-GB-ThomasNeural`^新增	一般
法文 (法國)	`fr-FR`	女性	`fr-FR-BrigitteNeural`^新增	一般
法文 (法國)	`fr-FR`	女性	`fr-FR-CelesteNeural`^新增	一般
法文 (法國)	`fr-FR`	女性	`fr-FR-CoralieNeural`^新增	一般
法文 (法國)	`fr-FR`	女性	`fr-FR-JacquelineNeural`^新增	一般
法文 (法國)	`fr-FR`	女性	`fr-FR-JosephineNeural`^新增	一般
法文 (法國)	`fr-FR`	女性	`fr-FR-YvetteNeural`^新增	一般
法文 (法國)	`fr-FR`	女孩	`fr-FR-EloiseNeural`^新增	一般
法文 (法國)	`fr-FR`	男性	`fr-FR-AlainNeural`^新增	一般
法文 (法國)	`fr-FR`	男性	`fr-FR-ClaudeNeural`^新增	一般
法文 (法國)	`fr-FR`	男性	`fr-FR-JeromeNeural`^新增	一般
法文 (法國)	`fr-FR`	男性	`fr-FR-MauriceNeural`^新增	一般
法文 (法國)	`fr-FR`	男性	`fr-FR-YvesNeural`^新增	一般
德文 (德國)	`de-DE`	女性	`de-DE-AmalaNeural`^新增	一般
德文 (德國)	`de-DE`	女性	`de-DE-ElkeNeural`^新增	一般
德文 (德國)	`de-DE`	女性	`de-DE-KlarissaNeural`^新增	一般
德文 (德國)	`de-DE`	女性	`de-DE-LouisaNeural`^新增	一般
德文 (德國)	`de-DE`	女性	`de-DE-MajaNeural`^新增	一般
德文 (德國)	`de-DE`	女性	`de-DE-TanjaNeural`^新增	一般
德文 (德國)	`de-DE`	女孩	`de-DE-GiselaNeural`^新增	一般
德文 (德國)	`de-DE`	男性	`de-DE-BerndNeural`^新增	一般
德文 (德國)	`de-DE`	男性	`de-DE-ChristophNeural`^新增	一般
德文 (德國)	`de-DE`	男性	`de-DE-KasperNeural`^新增	一般
德文 (德國)	`de-DE`	男性	`de-DE-KillianNeural`^新增	一般
德文 (德國)	`de-DE`	男性	`de-DE-KlausNeural`^新增	一般
德文 (德國)	`de-DE`	男性	`de-DE-RalfNeural`^新增	一般

如需可用語音的完整清單，請參閱語言支援。

發音精確度

已改善所有 he-IL 語音的英文單字發音。
改善和da-DK的cs-CZ字級發音精確度。
改善阿拉伯音調和希伯來文尼古德處理。
改善的實體讀取 ja-JP

Speech Studio

自訂神經語音：使用批次 API 啟用其他模型測試（長音訊 API）
音訊內容建立：啟用更多輸出格式

2021 年 10 月版本

新語言和聲音

已新增適用於類神經文字轉換語音的 49 種新語言和 98 種語音：

af-ZA阿弗里卡因斯（南非）、南非的Willem in af-ZA Afrikaans（南非）、阿姆哈裡奇的邁克德斯（衣索比亞）、阿梅哈在am-ETam-ET阿姆哈裡奇（衣索比亞）、阿拉伯文的法蒂瑪ar-AE（阿拉伯聯合大公國）、哈姆丹阿拉伯文（阿拉伯聯合大公國）、哈姆丹 ar-AE 阿拉伯文（阿拉伯聯合大公國）、萊拉ar-BH阿拉伯文（巴林）、阿裡ar-BH阿拉伯文（巴林）、阿米娜ar-DZ阿拉伯文（阿爾及利亞）、伊馬埃爾ar-DZ阿拉伯文（阿爾及利亞）、拉納ar-IQ阿拉伯文（伊拉克）、巴塞爾ar-IQ阿拉伯文（伊拉克）、薩納ar-JO阿拉伯文（約旦） ar-JO阿拉伯文（約旦）、阿拉伯文（科威特）、ar-KW法赫德ar-KW阿拉伯文（科威特）、伊曼ar-LY阿拉伯文（利比亞）、奧瑪律ar-LY阿拉伯文（利比亞）、穆納ar-MA阿拉伯文（摩洛哥）、賈瑪律ar-MA阿拉伯文（摩洛哥）、阿瑪律ar-QA阿拉伯文（卡達ar-QA）、阿馬尼阿拉伯文（卡達）、阿馬尼ar-SY阿拉伯文（敘利亞）、雷ar-SY姆在阿拉伯文（敘利亞）、雷姆ar-TN在阿拉伯文（突尼西亞）、赫迪ar-TN阿拉伯文（突尼西亞）、馬里姆ar-YE在阿拉伯文（葉門）薩利赫在ar-YE阿拉伯文（葉門），班格拉的納巴尼塔bn-BD（孟加拉國），普拉迪普在bn-BD班拉（孟加拉國），阿西利亞en-KE英語（肯亞），智利姆巴en-KE英文（肯亞），埃辛內en-NG英語（奈及利亞en-NG），伊馬尼英語（坦尚尼亞），伊馬en-TZ尼en-TZ英語（坦尚尼亞），索非亞es-BO在西班牙文（玻利維亞），馬塞洛es-BO在西班牙文（玻利維亞），卡塔利娜在es-CL西班牙文（智利），洛倫佐在es-CL西班牙文（智利），瑪麗亞在es-CR西班牙（哥斯大黎加）、西班牙的胡安es-CR（哥斯大黎加）、西班牙的貝爾基斯es-CU（古巴）、西班牙的曼努埃爾es-CU（古巴）、西班牙的拉莫納es-DO（多明尼加共和國）、西班牙的埃米利奧es-DO、西班牙的安德里亞es-EC（厄瓜多）、西班牙的路易士es-EC（厄瓜多）、特蕾莎es-GQ（赤道幾內亞）、西班牙的哈威爾es-GQ（赤道幾內亞）、馬塔在es-GT西班牙（瓜地馬拉）、安德列斯的es-GT西班牙人（瓜地馬拉）、卡拉es-HN西班牙（宏都拉斯）、西班牙的卡洛斯es-HN（宏都拉斯）、西班牙的約蘭達es-NI（尼加拉瓜）、費德里科es-NI西班牙（尼加拉瓜）、西班牙的瑪格麗塔es-PA（巴拿馬）、西班牙的羅伯托es-PA（巴拿馬）、卡米拉es-PE的西班牙亞歷克斯（秘魯es-PR）、西班牙的亞歷克斯（秘魯）、西班牙的卡es-PE里納（波多黎各）、西班牙的維克多es-PR（波多黎各）、塔尼亞es-PY在西班牙（巴拉圭）、西班牙的馬里奧（巴拉圭）、洛雷納在es-PYes-SV西班牙（薩爾瓦多）、羅德里戈es-SV西班牙（薩爾瓦多）、西班牙瓦倫蒂娜es-UY（烏拉圭）、西班牙的馬泰奧es-UY（烏拉圭）、西班牙的帕奧拉es-VE（委內瑞拉）、西班牙塞巴斯蒂安es-VE（委內瑞拉）、波斯語的迪拉拉fa-IR（伊朗）、波斯的法裡fa-IR德（伊朗）、菲律賓的布利察fil-PH、菲律賓的安傑洛fil-PH（菲律賓）、加利西亞的gl-ES薩貝拉、加里西亞的羅伊gl-ES，賈瓦尼斯的西蒂jv-ID（印尼），賈瓦尼斯的迪馬斯jv-ID（印尼），高棉的斯雷莫姆km-KH（柬埔寨），皮塞斯在km-KH高棉（柬埔寨），尼爾my-MM緬甸人（緬甸）、緬甸的蒂哈my-MM（緬甸）、索馬里的烏巴克斯so-SO（索馬里）、索馬里穆烏so-SO斯、桑達尼斯的圖蒂su-ID（印尼）、桑達尼斯的賈瓊su-ID（印尼）、斯瓦希利的雷希馬sw-TZ（坦尚尼亞）、道烏斯sw-TZ瓦希里（坦尚尼亞）、泰米爾的薩蘭尼亞ta-LK（斯里蘭卡）、塔米爾的庫瑪律ta-LK（斯里蘭卡）、泰米爾文的文巴ta-SG（新加坡）、泰米爾安布ta-SG（新加坡）、烏爾都的古爾ur-IN（印度）、烏爾都的薩勒曼ur-IN（印度）、烏茲別克的馬迪納uz-UZ（烏茲別克）、烏茲別克的薩多uz-UZ（烏茲別克）、祖魯的坦多zu-ZA（南非）、祖魯的安巴zu-ZA（南非）。

2021 年 9 月版本

英文（美國）的新聊天機器人語音en-US：薩拉，代表一個年輕女性成年人，更隨意地交談，最適合聊天機器人案例。
日本 ja-JP 語音納納米新增的新樣式：現在有三種新樣式可供 Nanami 使用：聊天、客戶服務和歡快。
整體發音改善：Ardi in id-ID、Premwadee in th-TH、Christel in da-DK、HoaiMy 和 NamMinh in vi-VN。
預覽版中zh-CN中文（普通話、中國）的兩個新聲音：小晨和小燕，針對自發的語音和客戶服務案例優化。

2021 年 7 月版本

類神經文字轉換語音更新

將希伯來文中的發音錯誤減少 20%。

Speech Studio 更新

自定義神經語音：將定型管線更新為 UniTTSv3，模型質量會隨著原音模型的定型時間減少 50%。
音訊內容建立：已修正自定義神經語音選取的「匯出」效能問題和 Bug。

2021 年 6 月版本

Speech Studio 更新

自定義神經語音：自定義神經語音訓練已擴充以支持東南亞。已發行的新功能，可支持數據上傳狀態檢查。
音訊內容建立：發行了支援自定義詞典的新功能。透過這項功能，用戶可以輕鬆地建立語彙檔案，並定義其音訊輸出的自定義發音。

2021 年 5 月版本

針對類神經 TTS 新增的新語言和語音

引進的十種新語言-10個新地區設定的20個新聲音被新增到神經TTS語言清單中：嚴 en-HK 英文（香港），薩姆 en-HK 英文（香港），莫利 en-NZ 英文（紐西蘭），米切爾 en-NZ 英文（紐西蘭），魯納 en-SG 英文（新加坡），韋恩 en-SG 英文（新加坡），萊亞 en-ZA 英文（南非），盧克 en-ZA 英文（南非），杜 gu-IN 吉拉提（印度），尼蘭詹在 gu-IN 古賈拉提（印度），阿羅希在 mr-IN 馬拉蒂（印度），馬諾哈爾在 mr-IN 馬拉蒂（印度），埃琳娜 es-AR 在西班牙（阿根廷），西班牙的湯瑪斯 es-AR （阿根廷），薩洛姆 es-CO 在西班牙（哥倫比亞），岡薩洛 es-CO 西班牙（哥倫比亞），帕洛馬 es-US 在西班牙（美國），阿隆索 es-US 在西班牙（美國），蘇里 sw-KE 在斯瓦希里（肯亞），拉菲基在斯瓦希利（肯亞），拉菲基在 sw-KE 斯瓦希利（肯亞）。
預覽版中的 11 個新的 en-US 語音 - 11 個新的 en-US 語音在預覽 中新增到美國英語，他們是阿什利，琥珀，安娜，布蘭登，克裡斯托弗，科拉，伊莉莎白，埃裡克，米歇爾，莫妮卡，雅各布。
五 zh-CN 個中文（普通話，簡體）語音正式推出 - 5個中文（普通話，簡體）的聲音從預覽改為正式推出。他們是雲溪、小莫、小曼、小軒、小瑞。現在，這些語音可在所有區域中使用。雲溪新增了新的「助理」樣式，適合聊天機器人和語音代理程式。小莫的語音風格被細化為更自然和特色。

2021 年 4 月版本

類神經文字轉換語音現已在 21 個區域提供

已新增 12 個新區域 - 類神經文字轉換語音現已在下列 12 個新區域提供：Japan East、Japan West、Korea Central、North Central US、North Europe、South Central US、Southeast Asia、UK South、west Central US、West Europe、West US 和 West US 2。請查看這裡以取得 21 個支援區域的完整清單。

2021 年 3 月版本

針對類神經 TTS 新增的新語言和語音

引進的六種新語言-12個新的地區設定新增到神經TTS語言清單中：威爾士的尼亞（英國），阿爾德在cy-GBcy-GB威爾士（英國），羅莎en-PH英語（菲律賓），詹姆斯en-PHfr-BE英語（菲律賓），詹姆斯英語（菲律賓），傑拉德fr-BE在法語（比利時），德納在nl-BE荷蘭（比利時），阿諾德在荷蘭（比利時），uk-UA阿諾德在nl-BE烏克蘭（烏克蘭），烏克蘭的奧斯塔普uk-UA（烏克蘭）、烏茲瑪在ur-PK烏爾都（巴基斯坦）、阿薩德在ur-PK烏爾都（巴基斯坦）。
從預覽版至正式發行的 5 種語言 - 11 月於 5 個地區設定中引進 10 種語音：et-EE愛沙尼亞文 (愛沙尼亞) 的 Kert、ga-IE愛爾蘭文 (愛爾蘭) 的 Colm、lv-LV拉脫維亞文 (拉脫維亞) 的 Nils、lt-LT立陶宛文 (立陶宛) 的 Leonas 和mt-MT馬爾他文 (馬爾他) 的 Joseph。
為法語（加拿大） 新增的男性聲音 - 新的聲音安托因適用於 fr-CA 法語（加拿大）。
品質改善 - 匈牙利語發音誤差率降低 hu-HU - 48.17%， nb-NO 挪威文 - 52.76%， nl-NL 荷蘭（荷蘭） - 22.11%。

在此版本中，我們現在支援 60 種語言/地區設定的 142 個神經語音。此外，49 種語言/地區設定提供超過 70 種標準語音。請流覽完整清單的語言支援。

取得臉部姿勢事件以動畫顯示字元

神經文字轉換語音目前包括描聲影像事件。 Viseme 事件可讓使用者取得一連串的臉部姿勢，以及合成的語音。 Visemes 可用來控制 2D 和 3D 虛擬人偶模型的移動，將口部移動與合成語音相符。 Viseme 事件目前僅適用於 en-US-AriaNeural 語音。

在語音合成標記語言中新增書籤元素（SSML）

bookmark 元素可讓您在 SSML 中插入自定義標記，以取得音訊數據流中每個標記的位移。它可以用來參考文字或標記序列中的特定位置。

2021 年 2 月版本

自定義神經語音 GA

自定義神經語音是 GA 在 2 月的 13 種語言：中文（普通話、簡體）、英文（澳大利亞）、英文（印度）、英文（英國）、英文（美國）、法文（加拿大）、法文（法國）、德文（德國）、義大利文（義大利）、日文（日本）、韓文（韓國）、葡萄牙文（巴西）、西班牙文（墨西哥）和西班牙文（西班牙）。深入了解什麼是自定義神經語音，以及如何負責任地使用它。自定義神經語音功能需要註冊，Microsoft 可能會根據 Microsoft 的資格準則來限制存取。深入瞭解有限的存取權。

2020 年 12 月版本

GA 和預覽中的新神經語音

針對 54 種語言/地區設定共發行 129 個神經語音的新語音：

GA 地區設定的 46 個新聲音：沙烏地阿拉伯ar-EG文（埃及），哈米德在ar-SA阿拉伯文（沙烏地阿拉伯），博里斯拉夫在bg-BG保加利亞（保加利亞），喬安娜在ca-ES加泰羅尼亞，捷克安東寧cs-CZ（捷克共和國）、丹麥的傑佩da-DK、德國的喬納斯de-AT（奧地利）、德文（瑞士）、de-CH希臘的內斯托拉斯el-GR（希臘）、利亞姆en-CA英語（加拿大）、康納en-IE英文（愛爾蘭）、印度語的馬杜爾en-IN（印度）、泰魯古的en-IN莫漢）普拉巴特en-IN英文（印度）、泰米爾文的瓦爾盧瓦爾en-IN（印度）、加泰羅尼亞的恩里克es-ES、愛沙尼亞的克爾特et-EE（愛沙尼亞）、芬蘭的哈裡（芬蘭）、芬蘭的塞爾瑪（芬蘭）、芬蘭的塞爾瑪fi-FIfr-CH、愛爾蘭的科爾姆（愛爾蘭）、愛爾蘭的科爾姆ga-IE、希伯來文的阿夫里fi-FIhe-IL（以色列）、克羅埃西亞的薩雷科hr-HR、匈牙利的塔hu-HU馬斯（匈牙利）、印尼的加迪斯id-ID（印尼）、立陶宛的萊昂納斯lt-LT（立陶宛）、尼爾斯lv-LV拉脫維亞文（拉脫維亞）、馬來語的奧斯曼ms-MY（馬來西亞）、馬爾他的約瑟夫mt-MT（馬爾他）、挪威的nb-NO芬恩、博克瑪律（挪威）、挪威的珀尼爾nb-NO、博克瑪律（挪威）、荷蘭的芬納nl-NL（荷蘭）、荷蘭的瑪律滕nl-NL、波蘭的阿格涅什卡pl-PL、波蘭的馬雷克pl-PL（波蘭）、葡萄牙的杜阿爾特pt-BR（巴西）、葡萄牙文的拉奎爾pt-PT（波圖加爾）、羅馬尼亞的埃米爾ro-RO（羅馬尼亞）、俄羅斯的德米特裡ru-RU、斯維特蘭納ru-RU俄羅斯（俄羅斯）、斯洛伐克的盧卡斯sk-SK、斯洛維尼亞的羅克sl-SI（斯洛維尼亞）、瑞典的馬蒂亞斯sv-SE（瑞典）、瑞典的索菲sv-SE（瑞典）、泰國的尼瓦th-TH特（泰國）、土耳其的艾哈邁特tr-TR（圖爾基耶） vi-VN 越南文（越南）、臺灣普通話（臺灣）、zh-TW雲傑zh-TW在臺灣普通話（臺灣）、粵語（香港特別管理員地區）、zh-HK萬隆zh-HK中國粵語（香港特別行政區）。
預覽地區設置的5個新聲音：愛沙尼亞克特 et-EE （愛沙尼亞）、愛爾蘭的科爾姆 ga-IE （愛爾蘭）、拉脫維亞的尼爾斯 lv-LV （拉脫維亞）、立陶宛的萊昂納斯 lt-LT （立陶宛）、馬爾他的 mt-MT 約瑟夫（馬爾他）。

在此版本中，我們現在支援54種語言/地區設定的129個神經語音。此外，49 種語言/地區設定提供超過 70 種標準語音。請流覽完整清單的語言支援。

音訊內容建立更新

已改善語音選取UI，其中包含語音類別和詳細的語音描述。
針對不同語言的所有神經語音啟用調音微調。
根據瀏覽器的語言自動進行UI當地語系化。
StyleDegree已啟用所有zh-CN類神經語音的控制件。請流覽音訊內容建立工具來查看新功能。

zh-CN 語音的更新

更新所有 zh-CN 神經語音以支持英語。
啟用所有 zh-CN 神經語音以支援調音調整。 SSML 或音訊內容建立工具可用來調整最佳音調。
已更新所有 zh-CN 多樣式神經語音以支援 StyleDegree 控制。情緒強度（軟或強）是可調整的。
已更新 zh-CN-YunyeNeural 以支援可執行不同情緒的多個樣式。

2020 年 11 月版本

預覽中的新地區設定和語音

類神經文字轉換語音組合引進五種新的語音和語言。它們是：馬爾他的格蕾絲（馬爾他）、立陶宛的奧納、愛沙尼亞的阿努（愛沙尼亞）、愛爾蘭的奧拉和拉脫維亞的埃弗里塔（拉脫維亞）。
五個新的 zh-CN 聲音與多種風格和角色支援：小漢，小莫，小瑞，小軒和雲溪。

這些語音可在三個 Azure 區域中公開預覽：EastUS、SouthEastAsia 和 WestEurope。

類神經文字轉換語音容器正式發行

使用類神經文字轉換語音容器時，開發人員可以在自身的環境中，使用最自然的數位語音來執行語音合成，以滿足特定的安全性和資料治理需求。檢查如何安裝語音容器。

新功能

自訂語音：可讓使用者將語音模型從某個區域複製到另一個區域;支援的端點暫停和繼續。請前往入口網站。
SSML 無聲標記支援。
一般 TTS 語音品質改善：改善 nb-NO 中的字級發音精確度。降低 53% 發音錯誤。

如需詳細資訊，請參閱此技術部落格。

2020 年 10 月版本

新功能

Jenny 支援新的 newscast 樣式。請參閱如何在 SSML 中使用說話樣式。
已升級至HiFiNet vocoder的神經語音，具有較高的音訊逼真度和更快的合成速度。這可讓案例依賴hi-fi音訊或長時間互動的客戶受益，包括視訊配音、音訊書籍或在線教育教材。深入瞭解此故事，並在我們的技術社群部落格上聽到語音範例
自訂語音和音訊內容建立 Studio 已當地語系化為 17 個地區設定。用戶可以輕鬆地將UI切換至本機語言，以取得更方便的體驗。
音訊內容建立：新增小曉的樣式度控件：精簡自定義中斷功能，以包含50毫秒的累加中斷。

一般 TTS 語音品質改善

改善字級發音精確度（ pl-PL 錯誤率降低：51%）和 fi-FI （錯誤率降低：58%）
已改善 ja-JP 字典案例的單字讀取。將發音錯誤減少 80%。
zh-CN-XiaoxiaoNeural：改善情感/CustomerService/Newscast/Cheerful/憤怒的風格語音品質。
zh-CN：改善了Erhua發音和輕音和精緻的空間音調，大大提高了可理解性。

2020 年 9 月版本

新功能

類神經文字轉換語音
- 擴充以支援18個新語言/地區設定。 它們是保加利亞文、捷克文、德文（奧地利）、德文（瑞士）、希臘文、英文（愛爾蘭）、法文（瑞士）、希伯來文、克羅埃西亞文、匈牙利文、印尼文、馬來語、羅馬尼亞文、斯洛伐克文、斯洛維尼亞文、泰米爾語、泰魯古語和越南語。
- 發行了 14 個新的聲音，以豐富現有語言的多樣性。 請參閱完整的語言和語音清單。
- 和 zh-CN 聲音的新口語風格en-US。 珍妮，英文的新聲音（美國），支援聊天機器人，客戶服務和助理樣式。我們的 zh-CN 語音小曉提供 10 種新的口語風格。此外，小曉神經語音支援 StyleDegree 微調。請參閱如何在 SSML 中使用說話樣式。
容器：在公開預覽版本中發行的類神經文字轉換語音容器，提供 14 種語言的 16 種語音。 深入了解如何部署適用於類神經文字轉換語音的語音容器

閱讀 Ignite 2020 TTS 更新的完整公告

2020 年 8 月版本

新功能

類神經文字轉換語音：新的en-US Aria 語音說話風格。 AriaNeural 在閱讀新聞時聽起來像新聞演員。 “新聞播式”風格聽起來更嚴肅，而“新聞播-休閒”風格更輕鬆和非正式。請參閱如何在 SSML 中使用說話樣式。
自訂語音：已發行新功能，以自動檢查定型數據品質。當您上傳數據時，系統會檢查音訊和文字記錄數據的各個層面，並自動修正或篩選問題，以改善語音模型的品質。這包括音訊音量、噪音等級、語音發音精確度、語音對齊方式與標準化文字、音訊中的無聲，以及音訊和腳本格式。
音訊內容建立：一組新功能，可啟用更強大的語音微調和音訊管理功能。
- 發音：發音微調功能會更新為最新的音素集。您可以從連結庫挑選正確的 phoneme 元素，並精簡您所選取字組的發音。
- 下載：音訊「下載」/「導出」功能已增強，以支援依段落產生音訊。您可以編輯相同檔案/SSML 中的內容，同時產生多個音訊輸出。「下載」的檔案結構也會精簡。現在，您可以輕鬆地取得一個資料夾中的所有音訊檔案。
- 工作狀態：已改善多檔案導出體驗。當您過去導出多個檔案時，如果其中一個檔案失敗，整個工作將會失敗。但現在，所有其他檔案都會成功導出。工作報告會以更詳細且結構化的資訊進行擴充。您可以使用報告來檢查所有失敗檔案和句子的記錄。
- SSML 檔：連結至 SSML 檔，可協助您檢查如何使用所有微調功能的規則。
語音清單 API 會更新為包含使用者易記的顯示名稱和類神經語音支援的說話樣式。

一般 TTS 語音品質改善

減少的字型發音錯誤 % ru-RU （錯誤減少 56%）和 sv-SE （錯誤減少 49%）
將神經語音上的 en-US 多音文字閱讀改善 40%。多語字的範例包括“read”、“live”、“content”、“record”、“object” 等。
改善了中 fr-FR問題語氣的自然性。 MOS （平均意見分數）獲得： +0.28
已更新下列語音的 vocoder，其逼真度改善和整體效能加速 40%。

地區設定語音

en-GB 米婭

es-MX 達利亞

fr-CA 西爾維

fr-FR 鄧尼斯

ja-JP 納納米

ko-KR Sun-Hi

地區設定	語音
`en-GB`	米婭
`es-MX`	達利亞
`fr-CA`	西爾維
`fr-FR`	鄧尼斯
`ja-JP`	納納米
`ko-KR`	Sun-Hi

錯誤修正

已使用音訊內容建立工具修正許多 Bug
- 已修正自動重新整理的問題。
- 已修正東南亞地區 zh-CN 語音樣式的問題。
- 已修正穩定性問題，包括具有「中斷」標籤的匯出錯誤，以及標點符號中的錯誤。

2024年4月版本

自動多語言語音翻譯（預覽）

公開預覽版提供自動多語言語音翻譯。這項創新的功能徹底改變了語言障礙的克服方式，為各種語言環境之間的無縫通訊提供無與倫比的功能。

主要醒目提示

未指定的輸入語言：多語言語音翻譯可以接收各種語言的音訊，而且不需要指定預期的輸入語言。它可讓您在不需要預先設定的情況下，跨全域內容瞭解和共同作業，這是一項寶貴的功能。
語言切換：多語言語音翻譯允許在相同的會話期間說出多種語言，並將它們全部翻譯成相同的目標語言。輸入語言變更或任何其他動作時，不需要重新啟動會話。

運作方式

旅遊翻譯：多語系語音翻譯可以藉由為他們提供慣用語言的信息和協助，來增強遊客到國外旅遊的體驗。酒店指引服務、導遊和遊客中心可以利用這項技術來滿足各種語言需求。
國際會議：多語種語音翻譯可以促進不同地區的參與者之間的溝通，他們可能會使用即時翻譯標題來說各種語言。出席者可以用原生語言說話，而不需要指定它們，以確保順暢地瞭解和共同作業。
教育會議：在多文化教室或在線學習環境中，多語言語音翻譯可以支援學生和教師之間的語言多樣性。它允許順暢的溝通和參與，而不需要指定每個學生或講師的語言。

如何存取

如需詳細的簡介，請瀏覽語音翻譯概觀。此外，您可以參考如何翻譯語音的程式碼範例。從 1.37.0 版起的所有 SDK 版本都完全支援這項新功能。

使用 diariazation 的即時語音轉換文字（GA）

使用 diariazation 的即時語音轉換文字現已正式推出。

您可以建立語音轉換文字應用程式，以使用聽寫來區分參與交談的不同說話者。如需即時 diarization 的詳細資訊，請參閱即時 diarization 快速入門。

語音轉換文字模型更新

即時語音轉換文字已發行具有雙語功能的新模型。此 en-IN 模型現在同時支援英文和印度語雙語案例，並提供改良的精確度。阿拉伯地區設定（ar-AE、、、ar-SAar-KWar-IQar-DZar-QAar-LBar-BHar-MAar-PSar-ILar-SYar-OMar-LY、ar-TN、、ar-YE）現在已配備英語雙語支援、增強精確度和客服中心支援。

批次轉譯為模型提供這些地區設定的新架構：es-ES、、es-MX、fr-FRit-IT、ja-JP、、ko-KR、 pt-BR和 zh-CN。這些模型可大幅增強可讀性和實體辨識。

2024 年 3 月版本

低語正式上市（GA）

現在已正式推出使用 Azure AI 語音的 Whisper 語音轉換文字模型。

請參閱什麼是 Whisper 模型？深入了解何時使用 Azure AI 語音與Azure OpenAI 服務。

2024年2月版本

發音評估

語音發音評估現在支援 23 種語言正式推出（新增 5 種語言），公開預覽中提供 3 種語言。如需詳細資訊，請參閱發音評定的完整語言清單。

語言	地區設定 (BCP-47)
阿拉伯文 (埃及)	`ar-EG`¹
阿拉伯文 (沙烏地阿拉伯)	`ar-SA`
中文 (廣東話，繁體)	`zh-HK`¹
中文 (國語，簡體)	`zh-CN`
荷蘭文 (荷蘭)	`nl-NL`¹
英文 (澳大利亞)	`en-AU`
英文 (加拿大)	`en-CA`
英文 (印度)	`en-IN`
英文 (英國)	`en-GB`
英文 (美國)	`en-US`
法文 (加拿大)	`fr-CA`
法文 (法國)	`fr-FR`
德文 (德國)	`de-DE`
印度文 (印度)	`hi-IN`
義大利文 (義大利)	`it-IT`
日文 (日本)	`ja-JP`
韓文 (韓國)	`ko-KR`
馬來文 (馬來西亞)	`ms-MY`
巴克摩挪威文 (挪威)	`nb-NO`
葡萄牙文 (巴西)	`pt-BR`
俄文 (俄羅斯)	`ru-RU`
西班牙文 (墨西哥)	`es-MX`
西班牙文 (西班牙)	`es-ES`
瑞典文 (瑞典)	`sv-SE`
坦米爾文 (印度)	`ta-IN`
越南文 (越南)	`vi-VN`

¹ 語言處於公開預覽狀態，以進行發音評估。

片語清單

已新增下列地區設定的詞組清單支援：ar-SA、de-CH、en-IE、en-ZA、es-US、id-ID、nl-NL、pl-PL、pt-PT、ru-RU、sv-SE、th-TH、vi-VN、zh-HK、zh-TW。

2023年11月版本

雙語語音模型簡介！

我們很高興推出即時語音模型化的開創性新增功能，即雙語語音模型化。這項重大增強功能可讓我們的語音模型順暢地支援雙語語言組，例如英文和西班牙文，以及英文和法文。此功能可讓使用者在即時互動期間輕鬆切換語言，這標誌著我們致力於增強通訊體驗的關鍵時刻。

主要醒目提示：

雙語支援：透過我們最新版本，用戶可以在即時語音互動中順暢地在英文與西班牙文之間切換，或在英文與法文之間切換。這項功能是專為容納經常在這兩種語言之間轉換的雙語演講者量身打造。
增強用戶體驗：雙語演講者，無論是在工作、家庭或各種社群設定中，都會發現這項功能非常有益。模型能夠即時理解和回應英文和西班牙文，為有效和流暢的溝通開闢了新的可能性。

如何使用：

當您呼叫語音服務 API 或在 Speech Studio 上試用時，請選擇 es-US （西班牙文和英文）或 fr-CA （法文和英文）。您可以隨意說出任一種語言或將它們混合在一起—此模型的設計目的是要動態調整，以這兩種語言提供精確且內容感知的回應。

是時候使用我們最新的功能版本來提升您的通訊遊戲— 順暢、多語種的通訊！

語音轉換文字模型更新

我們很高興能大幅更新語音模型、提升精確度、改善可讀性和精簡實體辨識。此升級隨附強固的新結構，由擴充的訓練數據集所支援，可確保整體效能明顯提升。它包含 en-US、zh-CN、ja-JP、it-IT、pt-BR、es-MX、es-ES、fr-FR、de-DE、ko-KR、tr-TR、sv-SE 和 he-IL 的新發行模型。

醒目提示：

新模型結構的精確度更佳：重新定義的模型結構，加上更豐富的定型數據集，提高精確度層級，承諾更精確的語音輸出。
可讀性改進：我們最新的模型可讀性大幅提升，增強了口語內容的一致性和清晰性。
進階實體辨識：實體辨識會收到大量升級，因而產生更精確且細微的結果。

潛在影響：儘管有這些進展，但請務必注意潛在影響：

自定義無聲逾時功能：採用自定義無聲逾時的使用者，特別是低設定，可能會遇到單字片語的過度分割和潛在的遺漏。
新的模型可能會顯示關鍵詞前置詞功能的相容性問題，建議用戶評估其特定應用程式中的效能。
減少不流暢的字組或片語：使用者可能會注意到語音輸出中的“um” 或 “uh” 等片語的減少。
單字時間戳持續時間不精確：某些不流暢的字組可能會在時間戳持續時間中顯示不準確之處，而需要關注相依於精確計時的應用程式。
信賴分數分佈差異：依賴信賴分數和相關聯臨界值的用戶應該知道分佈中的潛在變化，需要調整以獲得最佳效能。
片語清單功能的正確性增強可能會受到某些片語誤認的影響。

我們鼓勵您探索這些改進功能，並考慮順暢轉換的潛在問題，而且一如往常，您的意見反應有助於精簡和推進我們的服務。

發音評估

語音發音評估現在支援 18 種語言正式推出，公開預覽中提供六種語言。如需詳細資訊，請參閱發音評定的完整語言清單。
我們很高興宣佈自 2023 年 11 月 1 日起，發音評估引進新功能：Prosody、文法、詞彙和主題。這些增強功能旨在為閱讀和說話評估提供更全面的語言學習體驗。升級至 SDK 1.35.0 版或更新版本，以探索如何在 Speech Studio 中使用發音評定和發音評量中的進一步詳細數據。

2023 年 9 月發行版本

低語公開預覽

Azure AI 語音現在透過批次轉譯 API 支援 OpenAI 的 Whisper 模型。若要深入瞭解，請參閱建立批次轉譯指南。

注意

Azure OpenAI 服務也支援 OpenAI 的 Whisper 模型，以同步 REST API 將語音轉換文字。若要深入瞭解，請參閱快速入門。

請參閱什麼是 Whisper 模型？深入了解何時使用 Azure AI 語音與Azure OpenAI 服務。

語音轉換文字 REST API v3.2 公開預覽

語音轉換文字 REST API v3.2 提供預覽版。語音轉換文字 REST API v3.1 已正式推出。語音轉換文字 REST API v3.0 將於 2026 年 4 月 1 日淘汰。如需詳細資訊，請參閱語音轉換文字 REST API v3.0 至 v3.1 和 v3.1 至 v3.2 移轉指南。

2023 年 8 月版本

新的語音轉換文字地區設定：

語音轉換文字支援兩個新的地區設定，如下表所示。請參閱這裡的完整語言清單。

地區設定	語言
`pa-IN`	旁遮普文 (印度)
`ur-IN`	烏都文 (印度)

發音評估

語音發音評估現在支援 3 種語言，正式推出英文 (加拿大)、英文 (印度)，以及法文 (加拿大)，預覽版提供 3 種語言。如需詳細資訊，請參閱發音評定的完整語言清單。

2023 年 5 月版本

發音評估

語音發音評估現在支援 3 種其他語言，正式推出德文 (德國)、日文 (日本) 和西班牙文 (墨西哥)，預覽版提供 4 種語言。如需詳細資訊，請參閱發音評定的完整語言清單。
您現在可以使用標準語音轉換文字承諾層來評估所有公用區域的發音。如果您購買標準語音轉換文字的承諾層，發音評量的費用會達到承諾用量。請參閱承諾用量層定價。

2023 年 2 月版本

發音評估

語音發音評估現在支援 5 種其他語言，正式推出英文 (英國)、英文 (澳洲)、法文 (法國)、西班牙文 (西班牙)，以及中文 (中文、簡體中文)，以及預覽提供其他語言。
已新增範例程式碼，示範如何在您自己的應用程式中以串流模式使用發音評定。
- C#：請參閱範例程式碼。
- C++：請參閱範例程式碼。
- JAVA：請參閱範例程式碼。
- JavaScript：請參閱範例程式碼。
- Objective-C：請參閱範例程式碼。
- Python：請參閱範例程式碼。
- Swift：請參閱範例程式碼。

自訂語音

系統會針對 de-AT 地區設定新增音訊 + 人工標記文字記錄的支援。

2023 年 1 月版本

自訂語音

針對其他地區設定新增音訊 + 人工標記文字記錄的支援：ar-BH、ar-DZ、ar-EG、ar-MA、ar-SA、ar-TN、ar-YE 和 ja-JP。

已針對地區設定 de-AT 新增結構化文字調適的支援。

2022 年 12 月版本

語音轉換文字 REST API

語音轉換文字 REST API 3.1 版已正式推出。語音轉換文字 REST API 版本 3.0 將會淘汰。如需如何移轉的詳細資訊，請參閱指引。

2022 年 10 月版本

新的語音轉換文字地區設定

新增了對馬來亞蘭（印度） ml-IN 的支持與地區設定。請參閱這裡的完整語言清單。

2022 年 7 月版本

新的語音轉換文字地區設定：

已新增 7 個新的地區設定，如下表所示。請參閱這裡的完整語言清單。

地區設定	語言
`bs-BA`	波士尼亞（波士尼亞-黑塞哥維那）
`yue-CN`	中文（粵語，簡體）
`zh-CN-sichuan`	中文（西南普通話，簡體）
`wuu-CN`	中文（吳，簡體）
`ps-AF`	普什圖文 (阿富汗)
`so-SO`	索馬利文 (索馬利亞)
`cy-GB`	威爾斯文 (英國)

2022 年 6 月版本

新的語音轉換文字地區設定：

已新增 10 個新的地區設定，如下表所示。請參閱這裡的完整語言清單。

地區設定	語言
`sq-AL`	阿爾巴尼亞文 (阿爾巴尼亞)
`hy-AM`	亞美尼亞文 (亞美尼亞)
`az-AZ`	亞塞拜然文 (亞塞拜然)
`eu-ES`	巴斯克文
`gl-ES`	加利西亞文
`ka-GE`	喬治亞文 (喬治亞)
`it-CH`	義大利文 (瑞士)
`kk-KZ`	哈薩克文 (哈薩克)
`mn-MN`	蒙古文 (蒙古)
`ne-NP`	尼泊爾文 (尼泊爾)

2022 年 4 月版本

新的語音轉換文字地區設定：

以下是新地區設定的清單。請參閱這裡的完整語言清單。

地區設定	語言
`bn-IN`	孟加拉文 (印度)

2022 年 1 月版本

新的語音轉換文字地區設定：

以下是新地區設定的清單。請參閱這裡的完整語言清單。

地區設定	語言
`af-ZA`	南非荷蘭文 (南非)
`am-ET`	阿姆哈拉文 (衣索比亞)
`de-CH`	德文 (瑞士)
`fr-BE`	法文 (比利時)
`is-IS`	冰島文 (冰島)
`jv-ID`	爪哇文 (印尼)
`km-KH`	高棉文 (柬埔寨)
`kn-IN`	坎那達文 (印度)
`lo-LA`	寮文 (寮國)
`mk-MK`	馬其頓文 (北馬其頓)
`my-MM`	緬甸文 (緬甸)
`nl-BE`	荷蘭文 (比利時)
`si-LK`	僧伽羅文 (斯里蘭卡)
`sr-RS`	塞爾維亞文 (塞爾維亞)
`sw-TZ`	史瓦希里文 (坦尚尼亞)
`uk-UA`	烏克蘭文 (烏克蘭)
`uz-UZ`	烏茲別克文 (烏茲別克)
`zu-ZA`	祖魯文 (南非)

2021 年 7 月版本

新的語音轉換文字地區設定：

以下是新地區設定的清單。請參閱這裡的完整語言清單。

地區設定	語言
`ar-DZ`	阿拉伯文 (阿爾及利亞)
`ar-LY`	阿拉伯文 (利比亞)
`ar-MA`	阿拉伯文 (摩洛哥)
`ar-TN`	阿拉伯文 (突尼西亞)
`ar-YE`	阿拉伯文 (葉門)
`bg-BG`	保加利亞文 (保加利亞)
`el-GR`	希臘文 (希臘)
`et-EE`	愛沙尼亞文 (愛沙尼亞)
`fa-IR`	波斯文 (伊朗)
`ga-IE`	愛爾蘭文 (愛爾蘭)
`hr-HR`	克羅埃西亞文 (克羅埃西亞)
`lt-LT`	立陶宛文 (立陶宛)
`lv-LV`	拉脫維亞文 (拉脫維亞)
`mt-MT`	馬爾他文 (馬爾他)
`ro-RO`	羅馬尼亞文 (羅馬尼亞)
`sk-SK`	斯洛伐克文 (斯洛伐克)
`sl-SI`	斯洛維尼亞文 (斯洛維尼亞)
`sw-KE`	斯瓦希里文 (肯亞)

2021 年 1 月版本

新的語音轉換文字地區設定：

以下是新地區設定的清單。請參閱這裡的完整語言清單。

地區設定	語言
`ar-AE`	阿拉伯文 (阿拉伯聯合大公國)
`ar-IL`	阿拉伯文 (以色列)
`ar-IQ`	阿拉伯文 (伊拉克)
`ar-OM`	阿拉伯文 (阿曼)
`ar-PS`	阿拉伯文（巴勒斯坦權力機構）
`de-AT`	德文 (奧地利)
`en-GH`	英文 (迦納)
`en-KE`	英文 (肯亞)
`en-NG`	英文 (奈及利亞)
`en-TZ`	英文 (坦尚尼亞)
`es-GQ`	西班牙文 (赤道幾內亞)
`fil-PH`	菲律賓文 (菲律賓)
`fr-CH`	法文 (瑞士)
`he-IL`	希伯來文 (以色列)
`id-ID`	印尼文 (印尼)
`ms-MY`	馬來文 (馬來西亞)
`vi-VN`	越南文 (越南)

2020 年 8 月版本

新的語音轉換文字地區設定：

語音轉換文字已於 8 月發行 26 個新的地區設定：2 種歐洲語言 (cs-CZ 和 hu-HU)；涵蓋大部分的南美洲國家/地區的 5 個英文地區設定和 19 個西班牙文地區設定。以下是新地區設定的清單。請參閱這裡的完整語言清單。

地區設定	語言
`cs-CZ`	捷克文 (捷克共和國)
`en-HK`	英文 (香港特別行政區)
`en-IE`	英文 (愛爾蘭)
`en-PH`	英文 (菲律賓)
`en-SG`	英文 (新加坡)
`en-ZA`	英文 (南非)
`es-AR`	西班牙文 (阿根廷)
`es-BO`	西班牙文 (玻利維亞)
`es-CL`	西班牙文 (智利)
`es-CO`	西班牙文 (哥倫比亞)
`es-CR`	西班牙文 (哥斯大黎加)
`es-CU`	西班牙文 (古巴)
`es-DO`	西班牙文 (多明尼加)
`es-EC`	西班牙文 (厄瓜多)
`es-GT`	西班牙文 (瓜地馬拉)
`es-HN`	西班牙文 (宏都拉斯)
`es-NI`	西班牙文 (尼加拉瓜)
`es-PA`	西班牙文 (巴拿馬)
`es-PE`	西班牙文 (秘魯)
`es-PR`	西班牙文 (波多黎各)
`es-PY`	西班牙文 (巴拉圭)
`es-SV`	西班牙文 (薩爾瓦多)
`es-US`	西班牙文（美國）
`es-UY`	西班牙文 (烏拉圭)
`es-VE`	西班牙文 (委內瑞拉)
`hu-HU`	匈牙利文 (匈牙利)

2024年2月版本

新增最新模型版本的支援。

自訂語音轉換文字 4.6.0
語音轉換文字 4.6.0
類神經文字到語音轉換 3.1.0

將語音升級為文字元件至最新版本。將所有 es 地區設定模型升級至最新版本。增加語音轉換文字使用案例的媒體轉換緩衝區。

2023 年 11 月版本

新增最新模型版本的支援。

自訂語音轉換文字 4.5.0
語音轉換文字 4.5.0
類神經文字到語音轉換 2.19.0

2023年10月版本

新增最新模型版本的支援。

自訂語音轉換文字 4.4.0
語音轉換文字 4.4.0
類神經文字到語音轉換 2.18.0

修正一堆高風險弱點問題。

拿掉容器中的備援記錄。

將內部媒體元件升級至最新版本。

新增語音 en-IN-NeerjaNeural的支援。

2023年9月版本

新增最新模型版本的支援。

語音語言識別 1.12.0
自訂語音轉換文字 4.3.0
語音轉換文字 4.3.0
類神經文字到語音轉換 2.17.0

將自定義語音升級為文字，並將語音升級為文字至最新的架構。

修正弱點問題。

新增語音 ar-AE-FatimaNeural的支援。

2023 年 7 月版本

新增最新模型版本的支援。

自訂語音轉換文字 4.1.0
語音轉換文字 4.1.0
類神經文字轉換語音 2.15.0

使用本機自訂模型檔案，修正透過 docker 掛接選項執行語音轉換文字容器的問題。

修正在某些情況下， RECOGNIZING 事件不會透過語音 SDK 顯示回應的問題。

修正弱點問題。

2023 年 6 月版本

新增最新模型版本的支援。

自訂語音轉換文字 4.0.0
語音轉換文字 4.0.0
類神經文字轉換語音 2.14.0

內部部署語音轉換文字影像會升級至 .NET 6.0

升級地區設定的顯示模型，包括 en-us、ar-eg、ar-bhja-jp、ko-kr 等等。

升級語音轉換文字容器元件，以解決弱點問題。

新增地區設定語音 de-DE-AmalaNeural、de-AT-IngridNeural、de-AT-JonasNeural 和 en-US-JennyMultilingualNeural 的支援

2023 年 5 月版本

新增最新模型版本的支援。

自訂語音轉換文字 3.14.0
語音轉換文字 3.14.0
類神經文字轉換語音 2.13.0

修正 he-IL 標點符號問題

修正弱點問題

新增地區設定語音 en-US-MichelleNeural 和 es-MX-CandelaNeural

2023 年 4 月版本

安全性更新

修正弱點問題

2023 年 3 月版本

新增最新模型版本的支援。

自訂語音轉換文字 3.12.0
語音轉換文字 3.12.0
語音語言識別 1.11.0
類神經文字轉換語音 2.11.0

修正弱點問題

修正 tr-TR 大寫問題

升級語音轉換文字 en-US 顯示模式

將預先建置的類神經文字支援新增至語音地區設定語音 ar-AE-HamdanNeural

2023 年 2 月版本

新的容器版本

新增最新模型版本的支援：

自訂語音轉換文字 3.11.0
語音轉換文字 3.11.0
類神經文字到語音 2.10.0

修正弱點問題

語音模型的一般升級

新增 Abraic 地區設定：

ar-IL
ar-PS

升級希伯來文和土耳其文顯示模式

2023 年 1 月版本

新的容器版本

新增最新模型版本的支援：

自訂語音轉換文字 3.10.0
語音轉換文字 3.10.0
類神經文字轉換語音 2.9.0

修正假設模式問題

修正 HTTP Proxy 問題

自訂語音轉換文字容器中斷連線模式

將 CNV 已中斷連線的容器支援新增至 TTS 前端

新增這些地區設定的支援：

da-DK-ChristelNeural
da-DK-JeppeNeural
en-IN-PrabhatNeural

2022 年 12 月版本

新的容器版本

新增最新模型版本的支援：

自訂語音轉換文字 3.9.0
語音轉換文字 3.9.0
類神經文字轉換語音 2.8.0

修正 ipv4/ipv6 問題

修正弱點問題

2022 年 11 月版本

新的容器版本

新增最新模型版本的支援：

自訂語音轉換文字 3.8.0
語音轉換文字 3.8.0
類神經文字轉換語音 2.7.0

2022年10月版本

新的容器版本

新增最新模型版本的支援：

自訂語音轉換文字 3.7.0
語音轉換文字 3.7.0
類神經文字轉換語音 2.6.0

2022 年 9 月版本

語音轉換文字 3.6.0-amd64

新增最新模型版本的支援。

新增這些地區設定的支援：

az-az
bn-in
bs-ba
cy-gb
eu-es
fa-ir
gl-es
he-il
hy-am
it-ch
ka-ge
kk-kz
mk-mk
mn-mn
ne-np
ps-af
so-so
sq-al
wuu-cn
岳-cn
zh-cn-sichuan

定期每月更新，包括安全性升級和弱點修正。

自定義語音轉換文字 3.6.0-amd64

定期每月更新，包括安全性升級和弱點修正。

類神經文字轉換語音 v2.5.0

新增這些預先建置神經語音的支援：

az-az-babekneural
az-az-banuneural
fa-ir-dilaraneural
fa-ir-faridneural
fil-ph-angeloneural
fil-ph-blessicaneural
he-il-avrineural
he-il-hilaneural
id-id-ardineural
id-id-gadisneural
ka-ge-ekaneural
ka-ge-giorgineural

定期每月更新，包括安全性升級和弱點修正。

2022年5月版本

語音語言偵測容器 v1.9.0-amd64-preview

語音語言偵測的錯誤修正。

2022年3月版本

自訂語音轉換文字容器 v3.1.0

新增支援以取得顯示模型。

2022年1月版本

語音轉換文字容器 v3.0.0

新增在中斷連線的環境中使用容器的支援。

語音轉換文字容器 v2.18.0

定期每月更新，包括安全性升級和弱點修正。

類神經文字轉換語音容器 v1.12.0

新增這些預先建置神經語音的支援：am-et-amehaneural、 am-et-mekdesneuralso-so-muuseneural 和 so-so-ubaxneural。

定期每月更新，包括安全性升級和弱點修正。

Azure AI 語音有何新功能？

最近醒目提示

版本資訊

即將推出的 Linux 和 Android 使用者方案：

語音 SDK 1.37.0：2024 年 4 月版本

新功能

錯誤修正

範例

語音 SDK 1.36.0：2024 年 3 月版本

新功能

錯誤修正

範例

語音 SDK 1.35.0：2024 年 2 月版本

新功能

錯誤修正

範例

語音 SDK 1.34.1：2024 年 1 月版本

重大變更

新功能

錯誤修正

語音 SDK 1.34.0：2023 年 11 月版本

重大變更

新功能

錯誤修正

範例

語音 CLI 1.34.0：2023 年 11 月版本

新功能

錯誤修正

語音 SDK 1.33.0：2023 年 10 月版本

重大變更通知

新功能

錯誤修正

範例

語音 CLI 1.33.0：2023 年 10 月版本

新功能

錯誤修正

語音 SDK 1.32.1：2023 年 9 月版本

錯誤修正

範例

語音 SDK 1.31.0：2023 年 8 月版本

新功能

重大變更

錯誤修正

範例

語音 SDK 1.30.0：2023 年 7 月版本

新功能

錯誤修正

其他注意事項

範例

語音 SDK 1.29.0：2023 年 6 月版本

新功能

錯誤修正

範例

語音 SDK 1.28.0：2023 年 5 月版本

重大變更

新功能

錯誤修正

範例

語音 SDK 1.27.0：2023 年 4 月版本

即將進行的變更通知

新功能

錯誤修正

範例

語音 SDK 1.26.0：2023 年 3 月版本

重大變更

新功能

錯誤修正

範例

語音 SDK 1.25.0：2023 年 1 月版本

重大變更

新功能

錯誤修正

範例

語音 SDK 1.24.2：2022 年 11 月版本

新功能

錯誤修正

語音 SDK 1.24.1：2022 年 11 月版本

新功能

錯誤修正

語音 SDK 1.24.0：2022 年 10 月版本

範例（GitHub）