Azure AI 語音有何新功能？

文章
06/06/2024

Azure AI 語音會持續更新。為了讓您隨時掌握最新的開發訊息，此文章提供有關新版本與新功能的資訊。

版本資訊

選擇服務或資源

即將推出的 Linux 和 Android 使用者方案：

警告

本文參考 CentOS，這是一個處於終止服務 (EOL) 狀態的 Linux 發行版。請據此考慮您的使用方式和規劃。如需詳細資訊，請參閱 CentOS 生命週期結束指導。

語音 SDK 1.38.0：2024 年 6 月版本

新功能

升級語音 SDK Linux 平台需求：
- 新的最低基準為 Ubuntu 20.04 LTS，或與 glibc 2.31 或更新版本相容。
- Linux x86 的二進位檔會依照 Ubuntu20.04 平台支援移除。
- 請注意，RHEL/CentOS 7 會持續支援到 6 月 30 日 (CentOS 7 EOL 和 RHEL 7 維護支援 2 結束)。其二進位檔將會在語音 SDK 1.39.0 版本中移除。
在 Linux 上新增 OpenSSL 3 的支援。
使用語音合成器新增 g722-16khz-64kbps 音訊輸出格式的支援。
新增使用語音合成器透過連接物件傳送訊息的支援。
在 Objective-C 和 Swift 中新增 Start/StopKeywordRecognition API。
新增用於選取自訂翻譯模型類別的 API。
使用語音合成器更新 GStreamer 使用方式。

錯誤修正

修正 Start/StopKeywordRecognition 期間「Websocket 訊息大小不能超過 65536 個位元組」錯誤。
修正語音合成期間的 Python 分割錯誤。

範例

更新 C# 範例，以預設使用 .NET 6.0。

語音 SDK 1.37.0：2024 年 4 月版本

新功能

新增語音合成中輸入文字串流的支援。
將預設語音合成語音變更為 en-US-AvaMultilingualNeural。
更新 Android 組建以使用 OpenSSL 3.x。

錯誤修正

修正使用 MAS 時，在 SpeechRecognizer 處置期間偶爾發生 JVM 當機的問題。 (https://github.com/Azure-Samples/cognitive-services-speech-sdk/issues/2125)
改善 Linux 上預設音訊裝置的偵測。 (https://github.com/Azure-Samples/cognitive-services-speech-sdk/issues/2292)

範例

新功能已更新。

語音 SDK 1.36.0：2024 年 3 月版本

新功能

使用 AutoDetectSourceLanguageConfig::FromOpenRange() 在 v2 端點上新增語言識別支援。

錯誤修正

修正如果在 SynthesisStarted 事件期間呼叫 stop 則不會觸發 SynthesisCanceled 事件。
修正內嵌語音合成中的雜訊問題。
修正平行執行多個識別器時，內嵌語音辨識中的當機問題。
修正 v1/v2 端點上的片語偵測模式設定。
修正 Microsoft Audio Stack 的各種問題。

範例

新功能的更新。

語音 SDK 1.35.0：2024 年 2 月版本

新功能

將預設文字轉換語音，從 en-US-JennyMultilingualNeural 變更為 en-US-AvaNeural。
使用詳細的輸出格式，支援內嵌語音翻譯結果中的文字層級詳細資料。

錯誤修正

修正 Python 中的 AudioDataStream 位置 getter API。
使用 v2 端點修正語音翻譯，無需進行語言偵測。
修正內嵌文字轉換語音中的隨機當機和重複字邊界事件。
針對 WebSocket 連線上的內部伺服器錯誤，傳回正確的取消錯誤碼。
修正當 MAS 與 C# 搭配使用時，載入 FPIEProcessor.dll 程式庫失敗的問題。

範例

內嵌辨識範例的次要格式設定更新。

語音 SDK 1.34.1：2024 年 1 月版本

重大變更

僅限錯誤修正

新功能

僅限錯誤修正

錯誤修正

修正在 1.34.0 中引進的迴歸，其中服務端點 URL 是使用錯誤的區域設定資訊，針對多個中國地區的使用者所建立。

語音 SDK 1.34.0：2023 年 11 月版本

重大變更

SpeechRecognizer 已更新為預設使用新的端點 (也就是未明確指定 URL 時)，該端點不再支援大多數屬性的查詢字串參數。請使用對應的 API 函式，而不是使用 ServicePropertyChannel.UriQueryParameter 直接設定查詢字串參數。

新功能

與 .NET 8 的相容性 (適用於 https://github.com/Azure-Samples/cognitive-services-speech-sdk/issues/2170 的修正程式，但 centos7-x64 相關警告除外)
支援內嵌語音效能計量，可用來評估裝置執行內嵌語音的能力。
支援內嵌多語系翻譯中的來源語言識別。
支援 iOS 和 Swift/Objective-C 的內嵌語音轉換文字、文字轉換語音和翻譯，預覽版已發行。
MicrosoftCognitiveServicesSpeechEmbedded-iOS Cocoapod 中提供內嵌支援。

錯誤修正

適用於 iOS SDK x2 倍二進位大小成長的修正程式 · 問題 #2113 · Azure-Samples/cognitive-services-speech-sdk (github.com)
適用於無法從 Azure 語音轉換文字 API 取得文字層級時間戳記的修正程式 · 問題 #2156 · Azure-Samples/cognitive-services-speech-sdk (github.com)
適用於 DialogServiceConnector 解構階段以正確中斷事件連線的修正程式。這偶爾會造成當機。
適用於使用 MAS 時建立識別器期間之例外狀況的修正程式。
Microsoft.CognitiveServices.Speech.Extension.MAS NuGet 套件的 FPIEProcessor.dll (適用於 Windows UWP x64 和 ARM64) 相依於原生 C++ 的 VC 執行階段程式庫。已修正此問題，方法是更新相依性以更正 VC 執行階段程式庫 (適用於 UWP)。
適用於 [MAS] 使用 MAS 時重複呼叫 recognizeOnceAsync 導致 SPXERR_ALREADY_INITIALIZED 的修正程式 · 問題 #2124 · Azure-Samples/cognitive-services-speech-sdk (github.com)
適用於使用片語清單時內嵌語音辨識當機之問題的修正程式。

範例

語音轉換文字、文字轉換語音和翻譯的內嵌 iOS 範例。

語音 CLI 1.34.0：2023 年 11 月版本

新功能

在合成語音時支援字邊界事件輸出。

錯誤修正

已將 JMESPath 相依性更新為最新版本，改善了字串評估

語音 SDK 1.33.0：2023 年 10 月版本

中斷性變更通知

目前在套件設定檔中使用 MAS 的應用程式，需要包含針對 Microsoft Audio Stack (MAS) 新增的 NuGet 套件。

新功能

已新增新的 NuGet 套件 Microsoft.CognitiveServices.Speech.Extension.MAS.nupkg，可在使用 Microsoft Audio Stack 時提供改善的回音消除性能
發音評量：新增了對韻律和內容評估的支援，其可從韻律、詞彙、文法、主題等方面對口語進行評估。

錯誤修正

已修正關鍵字辨識結果偏移，使其自一開始就正確地符合輸入音訊串流。修正適用於獨立關鍵字辨識和關鍵字觸發的語音辨識。
已修正合成器 stopSpeaking 不會立即傳回 SPXSpeechSynthesizer stopSpeaking() 方法無法在 iOS 17 上立即傳回 - 問題 #2081
已修正使用 Apple 晶片的 Mac Catalyst 中 Swift 模組支援的 Mac Catalyst 匯入問題。問題 #1948
JS：AudioWorkletNode 模組載入現在使用受信任的 URL，並包含 CDN 瀏覽器的後援。
JS：已封裝的 lib 檔案現在以 ES6 JS 為目標，且已移除對 ES5 JS 的支援。
JS：以 v2 端點為目標之翻譯案例的中繼事件已正確處理
JS：TranslationRecognitionEventArgs 的語言屬性現在已針對 translation.hypothesis 事件進行設定。
語音合成：SynthesisCompleted 事件保證會在所有中繼資料事件之後發出，因此可用於指示事件結束。如何偵測何時完全接收描聲影像？問題 #2093 Azure-Samples/cognitive-services-speech-sdk

範例

已新增範例，以示範使用 Python 的 MULAW 串流)
適用於語音轉換文字 NAudio 範例的修正程式

語音 CLI 1.33.0：2023 年 10 月版本

新功能

在合成語音時支援字邊界事件輸出。

錯誤修正

none

語音 SDK 1.32.1：2023 年 9 月版本

錯誤修正

Android 套件會使用 OpenSSL1.1.1v 的最新安全性修正進行更新
JS – 新增 WebWorkerLoadType 屬性以允許略過逾時背景工作角色的資料 URL 載入
JS – 修正 10 分鐘後的交談翻譯中斷連線
JS – 來自交談的交談翻譯驗證權杖現在會傳播至翻譯服務連線

範例

使用 Swift API 進行交談謄寫

語音 SDK 1.31.0：2023 年 8 月版本

新功能

語音 SDK 1.31.0 公開預覽中提供即時自動分段標記的支援。這項功能適用於下列 SDK：C#、C++、JAVA、JavaScript、Python 和 Objective-C/Swift。
使用音訊播放同步的語音合成字邊界和描聲影像事件

重大變更

先前的「對話謄寫」案例已重新命名為「會議謄寫」。例如，使用 MeetingTranscriber 而非 ConversationTranscriber，並使用 CreateMeetingAsync 而非 CreateConversationAsync。雖然 SDK 物件和方法的名稱已變更，但重新命名不會造成功能變更。使用會議謄寫物件來謄寫具有使用者設定檔和語音簽章的會議。如需詳細資訊，請參閱會議謄寫。這些變更不會影響「對話翻譯」物件和方法。您仍然可以針對會議翻譯案例使用 ConversationTranslator 物件及其方法。

針對即時自動分段標記，會導入新的 ConversationTranscriber 物件。新的「對話謄寫」物件模型和呼叫模式類似於 SpeechRecognizer 物件的持續辨識。主要差異在於 ConversationTranscriber 物件是設計成用於對話案例中，您想要區分多個說話者 (自動分段標記)。使用者設定檔和語音簽章不適用。如需詳細資訊，請參閱即時自動分段標記快速入門。

下表顯示即時自動分段標記和會議謄寫的先前和新物件名稱。案例名稱位於第一個資料行，前一個物件名稱位於第二個資料行中，而新的物件名稱則位於第三個資料行中。

案例名稱	先前的物件名稱	新的物件名稱
即時自動分段標記	N/A	`ConversationTranscriber`
會議謄寫	`ConversationTranscriber` `ConversationTranscriptionEventArgs` `ConversationTranscriptionCanceledEventArgs` `ConversationTranscriptionResult` `RemoteConversationTranscriptionResult` `RemoteConversationTranscriptionClient` `RemoteConversationTranscriptionResult` `Participant`¹ `ParticipantChangedReason`¹ `User`¹	`MeetingTranscriber` `MeetingTranscriptionEventArgs` `MeetingTranscriptionCanceledEventArgs` `MeetingTranscriptionResult` `RemoteMeetingTranscriptionResult` `RemoteMeetingTranscriptionClient` `RemoteMeetingTranscriptionResult` `Participant` `ParticipantChangedReason` `User` `Meeting`²

¹Participant、ParticipantChangedReason 和 User 物件同時適用於會議謄寫和會議翻譯案例。

²Meeting 物件是新的，會與 MeetingTranscriber 物件搭配使用。

錯誤修正

已修正 macOS 最低支援版本 https://github.com/Azure-Samples/cognitive-services-speech-sdk/issues/2017
已修正發音評量錯誤 (bug)：
- 已解決韻律正確性分數問題，確保它們現在只準確地反映特定的錯誤韻律。 https://github.com/Azure-Samples/cognitive-services-speech-sdk/issues/1917
- 已解決發音評量功能不正確地將完全正確的發音識別為錯誤的問題，特別是在單字可能有多個有效發音的情況下。 https://github.com/Azure-Samples/cognitive-services-speech-sdk/issues/1530

範例

CSharp
- 新 C# 對話謄寫快速入門
- 新 C# 會議謄寫快速入門
JavaScript

語音 SDK 1.30.0：2023 年 7 月版本

新功能

C++、C#、JAVA - 已新增內嵌語音辨識詳細結果中 DisplayWords 的支援。
Objective-C/Swift - 已新增 Objective-C/Swift 中 ConnectionMessageReceived 事件的支援。
Objective-C/Swift - 改善 iOS 的關鍵字現成模型。這項變更已增加特定套件的大小，其中包含 iOS 二進位檔 (例如 NuGet、XCFramework)。我們正努力減少未來版本的大小。

錯誤修正

已修正搭配 PhraseListGrammar 使用語音辨識器時的記憶體流失，如客戶回報 (GitHub 問題)。
已修正文字轉換語音開啟連線 API 中的死結。

其他注意事項

JAVA - 某些內部使用的 publicJAVA API 方法已變更為封裝 internal、protected 或 private。這項變更不應該對開發人員產生影響，因為我們不會預期應用程式正在使用那些變更。此處已針對透明度所述。

範例

如何在您自己的應用程式中指定學習語言的新發音評量範例
- C#：請參閱範例程式碼。
- C++：請參閱範例程式碼。
- JavaScript：請參閱範例程式碼。
- Objective-C：請參閱範例程式碼。
- Python：請參閱範例程式碼。
- Swift：請參閱範例程式碼。

語音 SDK 1.29.0：2023 年 6 月版本

新功能

C++、C#、JAVA - 內嵌語音翻譯 API 的預覽。現在您可以執行語音翻譯，而不需要雲端連線！
JavaScript - 已針對語音翻譯啟用連續語言識別 (LID)。
JavaScript - 將 LocaleName 屬性新增至 VoiceInfo 類別的社群貢獻。感謝您 GitHub 使用者 shivsarthak 進行提取要求。
C++、C#、JAVA - 已新增從 16 kHz 到 48 kHz 採樣速率重新取樣內嵌文字轉換語音輸出的支援。
已新增在意圖識別器中使用樣本模式比對 hi-IN 的地區設定支援。

錯誤修正

已修正在物件解構期間，語音辨識器競爭條件所造成的損毀，如某些 Android 測試所示
已修正使用樣本模式比對器在意圖識別器中可能的死結

範例

新的內嵌語音翻譯範例

語音 SDK 1.28.0：2023 年 5 月版本

重大變更

JavaScript SDK：已移除線上憑證狀態通訊協定 (OCSP)。這可讓用戶端更符合憑證處理的瀏覽器和 Node 標準。 1.28 版和更新版本將不再包含我們的自訂 OCSP 模組。

新功能

內嵌語音辨識現在會在語句結束時發生無回應逾時時傳回 NoMatchReason::EndSilenceTimeout。這符合使用即時語音服務進行辨識時的行為。
JavaScript SDK：使用 PropertyId 列舉值設定 SpeechTranslationConfig 上的屬性。

錯誤修正

Windows 上的 C# - 修正 Windows 音訊延伸模組中的潛在競爭條件/死結。在同時快速處置音訊轉譯器，以及使用合成器方法來停止說話的情況下，基礎事件不會由停止重設，而且可能會導致轉譯器物件永遠不會處置，同時它可能會保留全域鎖定以處置，凍結 dotnet GC 執行緒。

範例

已新增 MAUI 的內嵌語音範例。
已更新 Android JAVA 的內嵌語音範例，以包含文字轉換語音。

語音 SDK 1.27.0：2023 年 4 月版本

即將進行的變更通知

我們計畫在下一個 JavaScript SDK 版本中移除線上憑證狀態通訊協定 (OCSP)。這可讓用戶端更符合憑證處理的瀏覽器和 Node 標準。 1.27 版是包含我們自訂 OCSP 模組的最後一個版本。

新功能

JavaScript – 已新增使用說話者辨識和驗證從瀏覽器輸入麥克風的支援。
內嵌語音辨識 - 更新 PropertyId::Speech_SegmentationSilenceTimeoutMs 設定的支援。

錯誤修正

一般 - 服務重新連線邏輯中的可靠性更新 (JavaScript 以外的所有程式設計語言)。
一般 - 修正 Windows (除了 JavaScript 以外所有相關程式設計語言) 上的字串轉換流失記憶體。
內嵌語音辨識 - 修正使用特定文法清單項目時法文語音辨識損毀的問題。
原始程式碼文件 - 修正 SDK 參考文件註解，與服務上的音訊記錄相關。
意圖辨識 - 修正與清單實體相關的模式比對器優先順序。

範例

在 C# 對話謄寫 (CTS) 樣本中正確處理驗證失敗。
已新增 Python、JavaScript、Objective-C 和 Swift 的串流發音評估範例。

語音 SDK 1.26.0：2023 年 3 月版本

重大變更

下列套件中的所有 iOS 目標都已停用 Bitcode：Cocoapod with xcframework、NuGet (適用於 Xamarin 和 MAUI) 和 Unity。此變更是因為 Apple 從 Xcode 14 和更新版本取代 Bitcode 支援。這項變更也表示如果您使用 Xcode 13 版本，或者您已使用語音 SDK 明確啟用應用程式上的 Bitcode，您可能會遇到錯誤，指出「架構不包含 Bitcode，而且您必須重建它」。若要解決此問題，請確定您的目標已停用 Bitcode。
此版本中的最低 iOS 部署目標已升級為 11.0，這表示不再支援 armv7 HW。

新功能

內嵌 (裝置上) 語音辨識現在支援 8 和 16-kHz 取樣率輸入音訊 (每個樣本 16-bit、單聲道 PCM)。
語音合成現在會報告結果中的連線、網路和服務延遲，以協助端對端延遲最佳化。
使用樣本模式比對進行意圖辨識的新中斷規則。比對的字元位元組越多，將會勝過具有較低字元位元組計數的模式比對。範例：模式「選取右上方的 {something}」將會勝過「選取 {something}」

錯誤修正

語音合成：修正 Emoji 在字邊界事件中不正確的錯誤。
使用交談語言理解 (CLU) 進行意圖辨識：
- 來自 CLU Orchestrator 工作流程的意圖現在會正確出現。
- JSON 結果現在可透過屬性識別碼 LanguageUnderstandingServiceResponse_JsonResult 取得。
使用關鍵字啟用的語音辨識：修正關鍵字辨識之後遺漏 ~150 毫秒的音訊。
修正語音 SDK NuGet iOS MAUI 發行組建，客戶 (GitHub 問題)

範例

修正由客戶回報的 Swift iOS 範例 (GitHub 問題)

語音 SDK 1.25.0：2023 年 1 月版本

重大變更

語言識別 (預覽) API 已經過簡化。如果您更新為語音 SDK 1.25 並看到建置中斷，請瀏覽 [語言識別] 頁面以了解新的屬性 SpeechServiceConnection_LanguageIdMode。這個單一屬性會取代前兩個 SpeechServiceConnection_SingleLanguageIdPriority 和 SpeechServiceConnection_ContinuousLanguageIdPriority 屬性。在最近的模型改進之後，不再需要在低延遲和高精確度之間設定優先順序。現在，您只需要選取在執行連續語音辨識或翻譯時，是否要在啟動時執行或連續語言識別。

新功能

C#/C++/JAVA：內嵌語音 SDK 現已在受閘道公開預覽下發行。請參閱內嵌語音 (預覽) 文件。當雲端連線斷斷續續或無法使用時，您現在可以進行裝置上的語音轉換文字和文字轉換語音。已支援 Android、Linux、macOS 和 Windows 平台
C# MAUI：在語音 SDK NuGet (客戶問題) 中已新增 iOS 和 Mac Catalyst 目標的支援
Unity：Android x86_64架構已新增至 Unity 套件 (客戶問題)
Go：
- 已針對語音辨識 (客戶問題) 新增 ALAW/MULAW 直接串流支援
- 已新增 PhraseListGrammar 的支援。感謝您 GitHub 使用者 czkoko 對社群貢獻！
C#/C++：意圖識別器現在支援 C++ 和 C# 中以及 Microsoft 服務上協調流程的交談語言理解模型

錯誤修正

修正在嘗試停止 KeywordRecognizer 時偶爾停止回應的問題
Python：
- 修正 PronunciationAssessmentGranularity.FullText 設定時取得發音評定結果 (客戶問題)
- 修正取得語音合成語音時未擷取男性語音的性別屬性
JavaScript
- 修正在 iOS 裝置 (客戶問題) 上記錄的一些 WAV 檔案
- JS SDK 現在會建置而不使用 npm-force-resolutions (Customer 問題)
- 使用使用 SpeechConfig.fromEndpoint() 建立的 speechConfig 執行個體時，對話翻譯工具現在已正確設定服務端點

範例

已新增示範如何使用內嵌語音的範例
已新增 MAUI 的語音轉換文字範例

請參閱語音 SDK 範例存放庫。

語音 SDK 1.24.2：2022 年 11 月版本

新功能

沒有新功能，只要內嵌引擎修正即可支援新的模型檔案。

錯誤修正

所有程式設計語言
- 已修正內嵌語音辨識模型的加密問題。

語音 SDK 1.24.1：2022 年 11月版本

新功能

內嵌語音預覽的已發佈套件。如需相關資訊，請參閱 https://aka.ms/embedded-speech 。

錯誤修正

所有程式設計語言
- 修正不支援語音字型時的內嵌 TTS 損毀
- 修正 stopSpeaking() 無法在 Linux (#1686) 上停止播放
JavaScript SDK
- 已修正交談轉譯閘道音訊方式的迴歸。
Java
- 暫時將 POM 和 Javadocs 檔案發佈至 Maven Central，讓文件管線能夠更新線上參考文件。
Python
- 修正 Python speak_text (ssml) 傳回 void 的回歸。

語音 SDK 1.24.0：2022 年 10 月版本

新功能

所有程式設計語言：AMR-WB (16khz) 新增至支援的文字轉換語音音訊輸出格式清單
Python：針對支援的 Linux 發行版本新增了適用於 Linux ARM64 的套件。
C#/C++/JAVA/Python：使用 AudioStreamWaveFormat 新增了對語音服務 (除了現有 PCM 串流) ALAW 與 MULAW 直接串流的支援。
C# MAUI：已更新 NuGet 套件以支援適用於 .NET MAUI 開發人員的 Android 目標 (客戶問題)
Mac：已新增個別的 XCframework for Mac，其中不包含任何 iOS 二進位檔。這可為只需要使用較小 XCframework 套件的 Mac 二進位檔開發人員提供選項。
Microsoft 音訊堆疊 (MAS)：
- 當指定波束成形角度時，來自指定範圍以外的音效將會受到更好的抑制。
- Linux ARM32 和 Linux ARM64 的 libMicrosoft.CognitiveServices.Speech.extension.mas.so 大小大約減少 70%。
使用模式比對的意圖辨識：
- 新增語言 fr、de、es 和 jp 的正寫法支援
- 已新增語言 es 的預先建置整數支援。

錯誤修正

iOS：修正 iOS 16 上壓縮音訊解碼失敗導致的語音合成錯誤 (客戶問題)。
JavaScript：
- 修正在取得語音合成語音清單時無法運作的驗證權杖 (客戶問題)。
- 使用資料 URL 載入背景工作角色 (客戶問題)。
- 只有在瀏覽器支援 AudioWorklet 時，才建立音訊處理器工作程式 (客戶問題)。這是 William Wong 的社群貢獻。感謝您，William！
- 修正 LUIS 回應 connectionMessage 為空時辨識的回撥 (客戶問題)。
- 正確設定語音分割逾時。
使用模式比對的意圖辨識：
- 模型內的非 JSON 字元現在會正確載入。
- 修正在連續辨識期間呼叫 recognizeOnceAsync(text) 的停止問題。

語音 SDK 1.23.0：2022 年 7 月版本

新功能

C#、C++、Java：已透過模式比對新增對語言 zh-cn 和 zh-hk 的意圖辨識支援。
C#：已新增對 AnyCPU .NET Framework 編譯的支援

錯誤修正

Android：已將 OpenSSL 更新為 1.1.1q，進而修正了 OpenSSL 弱點 CVE-2022-2068
Python：修正使用 PushAudioInputStream 時的損毀問題
iOS：修正 iOS 回報的「EXC_BAD_ACCESS：嘗試取值 null 指標」(GitHub 問題)

語音 SDK 1.22.0：2022 年 6 月版本

新功能

JAVA：已新增適用於 getEntities ()、applyLanguageModels () 和 recognizeOnceAsync(text) 的 IntentRecognitionResult API，以支援「樣本模式比對」引擎。
Unity：已新增適用於 Unity 套件的 Mac M1 (Apple Silicon) 支援 (GitHub 問題)
C#：已新增適用於 Xamarin Android 的 x86_64 支援 (GitHub 問題)
C#：.NET Framework 最低版本已更新為適用於 SDK C# 套件的 v4.6.2，因為 v4.6.1 已淘汰 (請參閱 Microsoft .NET Framework 元件生命週期原則)
Linux：已新增對 Debian 11 和 Ubuntu 22.04 LTS 的支援。 Ubuntu 22.04 LTS 需要從此處手動安裝 libssl1.1 做為二進位套件 (例如 libssl1.1_1.1.1l-1ubuntu1.3_amd64.deb 或適用於 x64 的更新版本)，或從來源編譯。

錯誤修正

UWP：從 UWP 程式庫移除 OpenSSL 相依性，並以 WinRT Websocket 和 HTTP API 取代，以符合安全性合規性和較小的二進位磁碟使用量。
Mac：已修正使用以 macOS 平台為目標的 Swift 專案時發生「找不到 MicrosoftCognitiveServicesSpeech 模組」問題
Windows、Mac：已修正透過屬性設定的音訊來源，以即時速率進行串流時，有時侯會落後且最終會超過容量的平台特定問題

範例 (GitHub)

C#：.NET Framework 範例已更新至使用 v4.6.2
Unity：已修正適用於 Android 和 UWP 的虛擬助理範例
Unity：已更新 Unity 範例至 Unity 2020 LTS 版本

語音 SDK 1.21.0：2022 年 4 月版本

新功能

JAVA 與 JavaScript：已新增使用 SpeechRecognizer 物件時，對連續語言識別的支援
JavaScript：已新增診斷 API 以啟用主控台記錄層級和 (僅節點) 檔案記錄，以協助 Microsoft 針對客戶回報的問題進行疑難排解
Python：已新增對話轉錄的支援
o：已新增對說話者辨識的支援
C++ 與 C#：已新增意圖識別器中對必要單字群組的支援 (簡單模式比對)。例如：「(設定|開始|啟動) 計時器」，其中「設定」、「開始」或「啟動」必須存在，才能辨識意圖。
所有程式設計語言、語音合成：在字邊界事件中已新增持續時間屬性。已新增對標點符號界限和句子界限的支援
Objective-C/Swift/JAVA：在發音評定結果物件上已新增文字層級結果 (類似 C#)。應用程式不再需要剖析 JSON 結果字串以取得文字層級資訊 (GitHub 問題)
iOS 平台：已新增對 ARMv7 架構的實驗性支援

錯誤修正

iOS 平台：修正使用 CocoaPod 時，允許針對目標「任何 iOS 裝置」進行建置 (GitHub 問題)
Android 平台：OpenSSL 版本已更新為 1.1.1n，以修正安全性弱點 CVE-2022-0778
JavaScript：修正未以檔案大小更新 wav 標頭的問題 (GitHub 問題)
JavaScript：修正中斷轉錄案例的要求識別碼非同步問題 (GitHub 問題)
JavaScript：修正具現化 SpeakerAudioDestination 時沒有串流的問題 (GitHub 問題)
C++：修正 C++ 標頭，以移除編譯 C++17 或更新版本時的警告

GitHub 範例

全新 JAVA 範例，適用於透過語言識別進行的語音辨識
全新 Python 和 JAVA 範例，適用於對話轉錄
全新 Go 範例，適用於說話者辨識
全新 C++ 和 C# 工具，適用於 Windows 列舉所有音訊擷取和轉錄裝置，以尋找其裝置識別碼。如果您打算從非預設裝置擷取音訊或轉錄音訊，則語音 SDK 會需要此識別碼。

語音 SDK 1.20.0：2022 年 1 月版本

新功能

Objective-C、Swift 和 Python：已新增對 DialogServiceConnector 的支援，用於語音助理案例。
Python：已新增對 Python 3.10 的支援。已移除對 Python 3.6 的支援，依據為 Python 的 3.6 生命週期結束。
Unity：Linux 上的 Unity 應用程式現可支援語音 SDK。
C++、C#：C# 現可支援使用模式比對的 IntentRecognizer。此外，C++ 和 C# 現可支援具有自訂實體、選擇性群組和實體角色的案例。
C++、C#：使用新的類別 FileLogger、MemoryLogger 和 EventLogger 改善診斷追蹤記錄。 SDK 記錄是 Microsoft 診斷客戶回報問題的重要工具。這些新類別可讓客戶更輕鬆地將語音 SDK 記錄整合到自己的記錄系統中。
所有程式設計語言：PronunciationAssessmentConfig 現在都有屬性可設定所需的音素字母 (IPA 或 SAPI) 和 N-Best Phoneme Count (避免需要撰寫設定 JSON，如 GitHub 問題 1284 所述)。此外，現也支援音節層級輸出。
Android、iOS 和 macOS (所有程式設計語言)：不再需要 GStreamer 就能支援受限頻寬網路。 SpeechSynthesizer 現在會使用作業系統的音訊解碼功能，以解碼從文字轉換語音服務串流的壓縮音訊。
所有程式設計語言：SpeechSynthesizer 現可支援三個新的原始輸出 Opus 格式 (不含容器)，這些格式在即時串流案例中受到廣泛使用。
JavaScript：已新增 getVoicesAsync () API 至 SpeechSynthesizer，以擷取支援的合成語音清單 (GitHub 問題 1350)
JavaScript：已新增 getWaveFormat () API 至 AudioStreamFormat 以支援非 PCM 波格式 (GitHub 問題 452)
JavaScript：已新增磁碟區 getter/setter 和 mute () /unmute () API 至 SpeakerAudioDestination (GitHub 問題 463)

錯誤修正

C++、C#、JAVA、JavaScript、Objective-C 和 Swift：修正以在停止使用 PushAudioInputStream 的語音辨識器時，移除 10 秒的延遲。這適用於呼叫 StopContinuousRecognition 後沒有推送新音訊的案例 (GitHub 問題 1318、331)
Android 和 UWP 上的 Unity：已修正 UWP、Android ARM64 和 Windows 子系統 Android 版 (WSA) ARM64 的 Unity 中繼檔案 (GitHub 問題 1360)
iOS：現已修正使用 CocoaPods 時在任何 iOS 裝置上編譯語音 SDK 應用程式 (GitHub 問題 1320)
iOS：當 SpeechSynthesizer 設定為將音訊直接輸出至喇叭時，播放會在罕見情況下停止。已修正此問題。
JavaScript：如果找不到音訊工作程式，則會使用指令碼處理器後援 (GitHub 問題 455)
JavaScript：新增通訊協定至代理程式，以降低 Sentry 整合時發生的 BUG (GitHub 問題 465)

GitHub 範例

C++、C#、Python 和 JAVA 範例，示範如何取得詳細的辨識結果。詳細資料包括替代辨識結果、信賴分數、語彙表單、標準化表單、遮罩標準化表單，以及每個結果的文字層級計時。
已新增 iOS 範例，使用 AVFoundation 做為外部音訊來源。
已新增 JAVA 範例，示範如何使用 WordBoundary 事件取得 SRT (SubRip Text) 格式。
Android 範例，適用於發音評定。
C++、C#，示範新的診斷記錄類別使用方式。

語音 SDK 1.19.0：2021 年 11 月版本

重點

說話者辨識服務現已正式發行 (GA)。語音 SDK API 適用於 C++、C#、JAVA 和 JavaScript。使用說話者辨識時，您可以依據說話者的獨特聲音特性，精準地驗證和識別說話者。如需此主題的詳細資訊，請參閱文件。
我們已中斷支援搭配 Azure DevOps 和 GitHub 的 Ubuntu 16.04。 Ubuntu 16.04 已於 2021 年 4 月中止支援服務。將 Ubuntu 16.04 工作流程移轉至 Ubuntu 18.04 或更新的版本。
Linux 二進位檔案中的 OpenSSL 連結已變更為動態。 Linux 二進位檔案大小已減少約 50%。
已新增對 Mac M1 ARM 型晶片的支援。

新功能

C++/C#/JAVA：已新增新的 API，以啟用 Microsoft 音訊堆疊語音輸入的音訊處理支援。文件在這裡。
C++：新的意圖辨識 API 可輔助更進階的模式比對。這包括清單和預建的整數實體，以及將意圖和實體分組為模型的支援 (文件、更新，和範例正在開發中，並且將在不久的未來中發行)。
Mac：支援適用於 CocoaPod、Python、JAVA 和與 GitHub 問題 #1244 相關的 NuGet 套件的 Silicon ARM64 (M1) 晶片。
iOS/Mac：iOS 和 macOS 二進位檔案已封裝至與 GitHub 問題 #919 相關的 xcframework。
iOS/Mac：支援與 GitHub 問題 #1171的 Mac Catalyst。
Linux：CentOS 7 新增新的 tar 套件有關語音 SDK。 Linux .tar 套件現已在 lib/centos7-x64 中包含適用於 RHEL/CentOS 7 的特定程式庫。 lib/x64 中的語音 SDK 程式庫仍適用於所有其他支援的 Linux x64 發行版本 (包括 RHEL/CentOS 8)，但無法在 RHEL/CentOS 7 上運作。
JavaScript：VoiceProfile 與 SpeakerRecognizer API 產生非同步/可等候。
JavaScript：已新增支援至美國政府的Azure 區域。
Windows：已新增支援通用 Windows 平台 (UWP) 的播放。

錯誤修正

Android：Android 套件的 OpenSSL 安全性更新 (已更新至 1.1.1l 版本)。
Python：已解決在 Python 上選擇喇叭裝置失敗的 BUG。
Core：連線失敗時自動重新連線。
iOS：由於使用 GStreamer 時有不穩定與 Bitcode 的編譯問題，使得 iOS 套件的音訊壓縮停用。透過 GitHub 問題 #1209，了解更多詳細資料。

GitHub 範例

Mac/iOS：已更新使用 xcframework 套件的範例和快速入門。
.NET：已更新範例，以使用 .NET Core 3.1 版本。
JavaScript：已新增語音助理的範例。

語音 SDK 1.18.0：2021 年 7 月版本

注意：從這裡開始使用語音 SDK。

重點摘要

Ubuntu 16.04 已於 2021 年 4 月中止支援服務。使用 Azure DevOps 和 GitHub，我們將於 2021 年 9 月中斷支援 16.04。將 Ubuntu 16.04 工作流程移轉至 Ubuntu 18.04 或更新的版本。

新功能

C++：符合意圖辨識器的簡單語言模式現在可讓您更輕鬆地執行簡單意圖辨識案例。
C++/C#/JAVA：我們已新增 GetActivationPhrasesAsync() API 至 VoiceProfileClient 類別，以接收適用於獨立辨識案例的說話者辨識註冊階段中的有效啟用片語清單。
- 重要事項：說話者辨識功能為預覽版。在預覽版中建立的所有語音設定檔，將會在說話者辨識功能移出預覽版本到正式運作後的 90 天中止。到時預覽語音設定檔將會停止運作。
Python：已新增支援現有 SpeechRecognizer 中的持續語言辨識 (LID) 和 TranslationRecognizer 物件。
Python：已新增名為SourceLanguageRecognizer 的新 Python 物件，以執行一次或持續 LID (無辨識或翻譯)。
JavaScript：已新增 getActivationPhrasesAsync API 至 VoiceProfileClient 類別，以接收適用於獨立辨識情節的說話者辨識註冊階段中的有效啟用片語清單。
JavaScript VoiceProfileClient 的enrollProfileAsync API 目前為非同步且可等候的。如需使用方式範例，請參閱此獨立識別程式碼。

改善

JAVA：AutoCloseable支援已新增至許多 Java 物件中。目前可支援 try-with-resources 模型以釋放資源。請參閱此使用 try-with-resources 的範例。也請參閱 Oracle JAVA 文件教學課程的 try-with-resources 陳述式，以學習此模式。
許多平台和架構的磁碟使用量大幅減少。 Microsoft.CognitiveServices.Speech.core 二進位檔案的範例：x64 Linux 減少 475KB (降低 8.0%)；ARM64 Windows UWP 減少 464KB (降低 11.5%)；x86 Windows 減少 343KB (降低 17.5%)；x64 Windows 減少 451KB (降低 19.4%)。

錯誤修正

JAVA：已修正合成文字包括代理字元的合成錯誤。如需更多詳細資料，請參考這裡。
JavaScript：瀏覽器麥克風音訊流程目前使用 AudioWorkletNode，而非取代 ScriptProcessorNode。如需更多詳細資料，請參考這裡。
JavaScript：在長時間執行的對話翻譯案例中，讓對話保持正確地運作。如需更多詳細資料，請參考這裡。
JavaScript：辨識器重新連線至連續辨識中 MediaStream 的問題已修正。如需更多詳細資料，請參考這裡。
JavaScript：已修正辨識器重新連線至連續辨識中 PushStream 的問題。如需更多詳細資料，請參考這裡。
JavaScript：更正詳細辨識結果中的文字層級位移計算。如需更多詳細資料，請參考這裡。

範例

JAVA 快速入門已於這裡更新範例。
JavaScript 說話者辨識範例已更新為顯示 enrollProfileAsync() 的新使用方式。請參閱這裡的範例。

語音 SDK 1.17.0：2021 年 5 月版本

注意

在這裡開始使用語音 SDK。

重點摘要

較小的磁碟使用量 - 我們會持續減少語音 SDK 及其元件的記憶體和磁碟使用量。
新的獨立語言識別 API 可讓您辨識所說的語言。
在 macOS 上使用 Unity 開發啟用混合現實與遊戲應用程式的語音。
除了語音辨識之外，您現在還可以使用來自 Go 程式設計語言的文字轉換語音。
修正幾個 BUG 可解決您 (我們最有價值的客戶) 標示在 GitHub 的問題！感謝您！請繼續提供意見反應！

新功能

C++/C#：透過 SourceLanguageRecognizer API 執行新的獨立開始和連續語言偵測。如果您只想要偵測音訊內容中所說的語言，這就是用來進行這項作業的 API。請參閱更多 C++ 和 C# 的詳細資料。
C++/C#：語音辨識和翻譯辨識目前支援開始和連續語言識別，因此您可以在執行謄寫或翻譯之前，用程式設計的方式判斷語音使用的是哪種語言。請參閱這裡的語音辨識和這裡的語音翻譯文件。
C#：新增 Unity 支援至 macOS (x64)。這會在混合現實和遊戲中將語音辨識和語音合成使用案例解除鎖定！
Go：我們已新增語音合成文字轉換語音的支援至 Go 程式設計語言中，使語音合成能在更多使用案例中使用。請參閱我們的快速入門或者我們的參考文件。
C++/C#/JAVA/Python/Objective-C/Go：語音合成器目前支援 connection 物件。這可協助您管理和監視語音服務的連線，而且特別有助於於預先連線以減少延遲。請參閱這裡的文件。
C++/C#/JAVA/Python/Objective-C/Go：我們目前會公開 SpeechSynthesisResult 中的延遲和不足時間，以協助您監視和診斷語音合成延遲問題。請參閱 C++、C#、JAVA、Python、Objective-C 和 Go 的詳細資料。
C++/C#/JAVA/Python/Objective-C：文字轉換語音在沒有指定使用語音下，預設使用神經語音。根據預設，這會提供您更高的精確度輸出，但也會增加預設價格。您可以指定任何我們超過 70 種標準語音或超過 130 種神經語音變更預設設定。
C++/C#/JAVA/Python/Objective-C/Go：我們新增性別屬性至合成語音資訊，使它更容易依照性別選擇語音。這個解決 GitHub 問題 #1055。
C++、C#、JAVA、JavaScript：我們現可支援說話者辨識的 retrieveEnrollmentResultAsync、getAuthorizationPhrasesAsync 和 getAllProfilesAsync()，以方便使用者管理特定帳戶的所有語音設定檔。請參閱 C++、C#、JAVA 和 JavaScript 的文件。這個解決 GitHub 問題 #338。
JavaScript：我們已新增連線失敗的重試，讓您的 JavaScript 語音應用程式更為穩固。

改善

已更新 Linux 和 Android 語音 SDK 二進位檔案，以使用最新版的 OpenSSL (1.1.1k)
程式碼大小改善：
- Language Understanding 現在會分割成獨立的「lu」程式庫。
- Windows x64 Core 二進位檔案的大小減少 14.4%。
- Android ARM64 Core 二進位檔案大小減少 13.7%。
- 其他元件的大小也會減少。

錯誤修正

All：已修正 GitHub 問題 #842 服務逾時。您現在可以使用語音 SDK 來謄寫長音訊檔案，無需擔心連線至服務因為此錯誤而終止。不過，我們仍建議您長檔案使用批次謄寫。
C#：已修正 GitHub 問題 #947，該問題為不好的狀態下無法在應用程式中留下語音輸入。
JAVA：已修正 GitHub 問題 #997，該問題為在沒有網路連線或是沒有訂用帳戶金鑰下使用 DialogServiceConnector 時，會導致適用於 JAVA 1.16 的語音 SDK 當機。
已修正突然停止語音辨識 (例如，在主控台應用程式上使用 CTRL + C) 時的當機。
JAVA：已新增修正，在使用適用於 JAVA 語音 SDK 時，可刪除 Windows 上的暫存檔案。
JAVA：已修正 GitHub 問題 #994，該問題為呼叫 DialogServiceConnector.stopListeningAsync 可能導致錯誤發生。
JAVA：已修正在虛擬助理快速入門中的客戶問題。
JavaScript：已修正 GitHub 問題 #366，該問題為 ConversationTranslator 會顯示「this.cancelSpeech 不是函式」的錯誤。
JavaScript：已修正 GitHub 問題 #298，該問題為「取得為記憶體串流結果」範例的播放聲音過大。
JavaScript：已修正 GitHub 問題 #350 ，該問題為呼叫 AudioConfig 可能導致「ReferenceError：MediaStream 未定義」。
JavaScript：已修正長時間執行工作階段， Node.js 中的 UnhandledPromiseRejection 警告。

範例

已於這裡更新 macOS 的 Uinity 範例文件。
您現在可以在這裡找到 Azure AI 語音辨識服務的 React Native 範例。

語音 SDK 1.16.0：2021 年 3 月版本

注意

Windows 上的語音 SDK 取決於 Visual Studio 2015、2017 和 2019 的共用 Microsoft 適用於 Visual Studio 的 Visual C++ 可轉散發套件。在這裡下載。

新功能

C++/C#/JAVA/Python：已移至最新版本的 GStreamer (1.18.3)，以在 Windows、Linux 和 Android 上新增對轉錄任何媒體格式的支援。請參閱這裡的文件。
C++/C#/JAVA/Objective-C/Python：已新增解碼壓縮 TTS / 合成音訊到 SDK 的支援。如果您將輸出音訊格式設定為 PCM，而且 GStreamer 可在系統上使用，則 SDK 將會自動從服務要求壓縮的音訊，以節省頻寬，並在用戶端上解碼音訊。您可以設定 SpeechServiceConnection_SynthEnableCompressedAudioTransmission 到 false，以停用這項功能。 C++、C#、JAVA、Objective-C 和 Python 的詳細資料。
JavaScript：Node.js 使用者現在可以使用 AudioConfig.fromWavFileInput API。這個解決 GitHub 問題 #252。
C++/C#/JAVA/Objective-C/Python：已新增 TTS 到傳回所有可用的合成語音的 GetVoicesAsync() 方法。 C++、C#、JAVA、Objective-C 和 Python 的詳細資料。
C++/C#/JAVA/JavaScript/Objective-C/Python：已新增 VisemeReceived 事件，讓 TTS / 語音合成傳回同步的發音嘴型動畫。請參閱這裡的文件。
C++/C#/JAVA/JavaScript/Objective-C/Python：已新增 TTS 的 BookmarkReached 事件。您可以在輸入 SSML 中設定書簽，並取得每個書簽的音訊位移。請參閱這裡的文件。
JAVA：已新增對說話者辨識 API 的支援。如需更多詳細資料，請參考這裡。
C++/C#/JAVA/JavaScript/Objective-C/Python：已新增兩個適用於 TTS (Webm16Khz16BitMonoOpus 和 Webm24Khz16BitMonoOpus)，具有 WebM 容器的輸出語音格式。這些是使用 Opus 轉碼器串流音訊的較佳格式。 C++、C#、JAVA、JavaScript、Objective-C 和 Python 的詳細資料。
C++/C#/JAVA：已新增對說話者辨識案例擷取語音設定檔的支援。 C++、C# 和 JAVA 的詳細資料。
C++/C#/JAVA/Objective-C/Python：已新增音訊麥克風和喇叭控制的獨立共享程式庫支援。這可讓開發人員在無需必要音訊程式庫相依性的環境中使用 SDK。
Objective-C/Swift：已新增模組架構的傘標頭支援。這可讓開發人員將語音 SDK 匯入為 iOS/Mac Objective-C/Swift 應用程式中的模組。這個解決 GitHub 問題 #452。
Python：已新增支援 Python 3.9，並中斷支援每個 Python 的3.5 中止支援服務的 Python 3.5。

已知問題

C++/C#/JAVA：DialogServiceConnector 無法使用 CustomCommandsConfig 存取自訂命令應用程式，且將會代替遇到連線錯誤。這可以透過手動將您的應用程式識別碼新增至具有 config.SetServiceProperty("X-CommandsAppId", "your-application-id", ServicePropertyChannel.UriQueryParameter) 的要求，來解決此問題。下個版本將會還原 CustomCommandsConfig 的預期行為。

改善

減少語音 SDK 的記憶體使用量和磁碟使用量作為我們在多個版努力過程中，使得 Android 二進位檔案的大小減少 3% 至 5%。
請於這裡參閱 C# 參考文件的已改善精確性、可讀性和「另請參閱」章節。

錯誤修正

JavaScript：大型 WAV 檔案標頭現在可以正確剖析 (增加標頭切片至 512 位元組)。這個解決 GitHub 問題 #962。
JavaScript：如有麥克風串流在停止辨識之前結束的狀況，麥克風時間點的問題已修正，並解決在 Firefox 中無法使用語音辨識的問題。
JavaScript：當瀏覽器在 turnOn 完成之前強制麥克風關閉時，我們現在會正確處理初始化的 Promise。
JavaScript：我們以 url-parse 取代 URL 相依性。這個解決 GitHub 問題 #264。
Android：已修正當 minifyEnabled 設定為真時，回撥無法運作的問題。
C++/C#/JAVA/Objective-C/Python：TCP_NODELAY 將會正確地設定 TTS 的基礎通訊端 IO，以降低延遲。
C++/C#/JAVA/Python/Objective-C/Go：已修正開始辨識後識別器立即終結所產生的偶爾當機。
C++/C#/JAVA：已修正喇叭辨識器終結時偶爾產生的當機。

範例

JavaScript：瀏覽器範例不再要求下載獨立 JavaScript 程式庫檔案。

語音 SDK 1.15.0：2021 年 1 月版本

注意

Windows 上的語音 SDK 取決於 Visual Studio 2015、2017 和 2019 的共用 Microsoft 適用於 Visual Studio 的 Visual C++ 可轉散發套件。在這裡下載。

重點摘要

更小的記憶體和磁碟使用量使得 SDK 更有效率。
適用於自訂神經語音個人預覽版的較高精確度輸出格式。
意圖辨識器現在會傳回比最上層意圖還多，讓您能夠對客戶的意圖進行個別的評量。
語音助理和聊天機器人現在更容易設定，而且您可以讓它立即停止聆聽，並更有效地控制其回應錯誤的方式。
透過將壓縮設為選擇性，改善裝置效能。
在 Windows ARM / ARM64 上使用語音 SDK。
已改善底層的偵錯。
發音評定功能的使用範圍更廣泛。
修正幾個 BUG 可解決您 (我們最有價值的客戶) 標示在 GitHub 的問題！感謝您！請繼續提供意見反應！

改善

語音 SDK 現在更有效率且更輕量。我們已開始進行多個版本的工作，以減少語音 SDK 的記憶體使用量和磁碟使用量。第一步，我們在大部分平台上的共用程式庫中大幅減少檔案大小。相較於 1.14 版本：
- 64 位元與 UWP 相容的 Windows 程式庫大小減少約為 30%。
- 32 位元 Windows 程式庫尚未有大小改善。
- Linux 程式庫的大小減少 20 到 25%。
- Android 程式庫的大小減少 3 到 5%。

新功能

全部：提供新的 48KHz 輸出格式，可透過 TTS 語音合成 API 自訂神經語音的個人預覽：Audio48Khz192KBitRateMonoMp3、audio-48KHz-192kbitrate-mono-Mp3、Audio48Khz96KBitRateMonoMp3、audio-48KHz-96kbitrate-mono-Mp3、Raw48Khz16BitMonoPcm、raw-48KHz-16bit-mono-Pcm、Riff48Khz16BitMonoPcm、riff-48KHz-16bit-mono-pcm。
全部：自訂語音也易於使用。已新增透過 EndpointId (C++、C#、JAVA、JavaScrip、Objective-C 和 Python) 設定自訂語音支援。在此變更之前，自訂語音使用者需要透過 FromEndpoint 方法設定端點 URL。現在客戶可以使用 FromSubscription 的方法，就像預先建立的語音一樣，然後藉由設定 EndpointId 提供部署識別碼。這可簡化自訂語音的設定。
C++/C#/JAVA/Objective-C/Python：從 IntentRecognizer 取得超過的最上層意圖。它現在支援透過使用 verbose=true uri 參數的 LanguageUnderstandingModel FromEndpoint 方法來設定包括所有意圖的 JSON 結果，而不是只有排名最高的評分意圖。這個解決 GitHub 問題 #880。請參閱這裡的更新文件。
C++/C#/JAVA：使得您的語音助理或聊天機器人立即停止聆聽。 DialogServiceConnector (C++、C#、JAVA) 目前有隨附 ListenOnceAsync() 的StopListeningAsync() 方法。這會立即停止音訊擷取並正常等候結果，使其非常適合用於「立即停止」按鈕的情況。
C++/C#/JAVA/JavaScript：讓您的語音助理或聊天機器人能更妥善地回應基礎系統錯誤。 DialogServiceConnector (C++、C#、JAVA 和 JavaScript) 目前有新的 TurnStatusReceived 事件處理常式。這些選擇性事件對應至聊天機器人上的每個 ITurnContext 解析度，並會在發生失敗時回報回合執行失敗，例如因為未處理的例外狀況、逾時或 Direct Line Speech 與聊天機器人之間的網路中斷。 TurnStatusReceived 使您能更輕鬆地回應錯誤狀況。例如，如果聊天機器人在後端資料庫查詢的時間太長 (例如查閱產品)，TurnStatusReceived 可讓用戶端知道「很抱歉，我不了解您的意思，您可以再試一次」或類似內容的重新提示。
C++/C#：在更多平台使用語音 SDK。語音 SDK NuGet 套件現已支援 Windows 的 ARM/ARM64 桌面原生二進位檔 (已支援 UWP)，讓語音 SDK 更適合更多電腦類型。
JAVA：DialogServiceConnector 目前具有 setSpeechActivityTemplate() 方法，會無意地將之前的語言排除在外。這相當於設定 Conversation_Speech_Activity_Template 屬性，而且要求 Direct Line Speech 服務未來所有產生的 Bot Framework 活動與提供的內容合併到其 JSON 承載中。
JAVA：改善底層的偵錯。 Connection 類別現在具有 MessageReceived 事件，類似其他程式語言 (C++ 和 C#)。此事件可讓您從服務取得內送資料的低層級存取權，並且有助於診斷和偵錯。
JavaScript：更輕鬆透過 BotFrameworkConfig 設定語音助理和聊天機器人，目前具有 fromHost() 和 fromEndpoint() Factory 方法，可簡化使用自訂服務位置和手動設定屬性。我們也將 botId 的選擇性規格標準化，以在設定處理站中使用非預設的聊天機器人。
JavaScript：已透過新增 websocket 壓縮的字串控制屬性改善裝置效能。基於效能考量，我們預設停用 WebSocket 壓縮。這可以針對低頻寬案例重新啟用。這裡提供更多詳細資料。這個解決 GitHub 問題 #242。
JavaScript：已新增對發音評定的支援，以啟用語音發音評定。請參閱這裡的快速入門。

錯誤修正

全部 (JavaScript 除外)：已修正 1.14 版本中的迴歸，由於識別器分配到過多的記憶體。
C++：已使用 DialogServiceConnector 修正記憶體回收問題，解決 GitHub 問題 #794。
C#：已修正執行緒關機的問題，該問題會在處置時造成物件約 1 秒的阻礙。
C++/C#/JAVA：已修正例外狀況，避免應用程式在 DialogServiceConnector 上設定語音授權權杖或活動範本超過一次以上。
C++/C#/JAVA：已修正由於終止競爭條件造成的識別器當機。
JavaScript：DialogServiceConnector 先前並未接受選用專屬 BotFrameworkConfig 處理站的 botId 參數。這使得 botId 查詢字串參數必須手動設定為使用非預設的聊天機器人。 BUG 已經修正，且已提供給 BotFrameworkConfig 處理站的 botId 值將會被接受和使用，包括新的 fromHost() 和 fromEndpoint() 加法。這也適用於 CustomCommandsConfig 的 applicationId 參數。
JavaScript：已修正 GitHub 問題 #881，允許辨識器物件重新使用。
JavaScript：已修正 SKD 於一次 TTS 工作階段傳送 speech.config 多次，浪費頻寬的問題。
JavaScript：簡化麥克風授權錯誤處理，在使用者未允許其瀏覽器上的麥克風輸入時，允許更多描述性訊息湧現。
JavaScript：已修正 GitHub 問題 #249，該問題為 ConversationTranslator 和 ConversationTranscriber 的類型錯誤導致 TypeScript 使用者的編譯錯誤。
Objective-C：已修正 iOS 在 Xcode 11.4 上 GSsreamer 組建失敗的錯誤，並解決 GitHub 問題 #911。
Python：已修正 GitHub 問題 #870，移除「DeprecationWarning：已取代 imp 模組以支持 importlib」。

範例

JavaScript 瀏覽器 From-File 的範例目前使用語音辨識的檔案。這個解決 GitHub 問題 #884。

語音 SDK 1.14.0：2020 年 10 月版本

注意

Windows 上的語音 SDK 取決於 Visual Studio 2015、2017 和 2019 的共用 Microsoft 適用於 Visual Studio 的 Visual C++ 可轉散發套件。在這裡下載。

新功能

Linux：已新增 Debian 10 和 Ubuntu 20.04 LTS 的支援。
Python/Objective-C：已新增 KeywordRecognizer API 支援。文件將會在這裡。
C++/JAVA/C#：已新增支援透過 ServicePropertyChannel::HttpHeader 設定任何 HttpHeader 金鑰 / 值。
JavaScript：已新增 ConversationTranscriber API 支援。請閱讀這裡的文件。
C++/C#：已新增新的 AudioDataStream FromWavFileInput 方法 (以讀取 .WAV 檔案) 至這裡 (C++) 和這裡 (C#)。
C++/C#/JAVA/Python/Objective-C/Swift：新增 stopSpeakingAsync() 方法以停止文字轉換語音合成。閱讀這裡 (C++)、這裡 (C#)、這裡 (JAVA)、這裡 (Python) 和這裡 (Objective-C/Swift) 的參考文件。
C#、C++、JAVA：已新增 FromDialogServiceConnector() 函式至 Connection 類別，可以用於監視 DialogServiceConnector 的連線和中斷連線事件。閱讀這裡 (C#)、這裡 (C++) 和這裡 (JAVA) 的參考文件。
C++/C#/JAVA/Python/Objective-C/Swift：已新增發音評定支援，該支援可評估語音發音，並提供說話者精確性和口語音訊流暢度的意見反應。請閱讀此處的文件。

重大變更

JavaScript：PullAudioOutputStream.read() 具有從內部 Promise 到原生 JavaScript Promise 的傳回型別變更。

錯誤修正

全部：已修正 1.13 版本在 SetServiceProperty 的迴歸，該問題為忽略部分特殊字元的值。
C#：已修正 Visual Studio 2019 上找不到原生 DLL 的 Windows 主控台範例。
C#：已修正如果串流作為 KeywordRecognizer 輸入使用，所造成的記憶體管理當機。
ObjectiveC/Swift：已修正如果串流作為識別器輸入使用，所造成的記憶體管理當機。
Windows：已修正 UWP 上 BT HFP/A2DP 共存的問題。
JavaScript：已修正工作階段識別碼的對應，以改善內部偵錯 / 服務相互關聯的記錄和協助。
JavaScript：已新增在第一次呼叫後DialogServiceConnector停用ListenOnce呼叫的修正程式。
JavaScript：已修正結果只會輸出「簡單」的問題。
JavaScript：已修正 macOS 中 Safari 持續辨識的問題。
JavaScript：高要求運輸量案例的 CPU 負載風險降低。
JavaScript：允許存取語音設定檔註冊結果。
JavaScript：已新增 IntentRecognizer 的連續辨識修正程式。
C++/C#/JAVA/Python/Swift/ObjectiveC：已修正 IntentRecognizer 中不正確的 AustraliaEast 和 BrazilSouth URL。
C++/C#：已新增 VoiceProfileType 作為建立 VoiceProfile 物件的引數。
C++/C#/JAVA/Python/Swift/ObjectiveC：已修正從特定位置嘗試讀取 SPX_INVALID_ARG 時，潛在的 AudioDataStream。
iOS：已修正 Unity 上的語音辨識當機

範例

ObjectiveC：已於這裡新增關鍵字辨識範例。
C#/JavaScript：已新增對話謄寫的快速入門至這裡 (C#) 和這裡 (JavaScript)。
C++/C#/JAVA/Python/Swift/ObjectiveC：已新增發音評定的範例至此處
Xamarin：已更新最新 Visual Studio 範本的快速入門至這裡。

已知問題

HoloLens 2 和 Android 4.4 (KitKat) 中預設不支援 DigiCert 全域根 G2 憑證，且必須將其新增至系統，才能讓語音 SDK 正常運作。憑證會在不久的將來新增至 HoloLens 2 OS 映像。 Android 4.4 的客戶必須將更新的憑證新增至系統。

COVID-19 簡易測試

由於過去幾週的遠端工作，我們無法像往常一樣執行手動驗證測試。我們未進行任何可能造成錯誤的變更，並且全數通過我們的自動化測試。萬一我們遺漏了什麼，請在 GitHub 上告訴我們。
保持身體健康！

語音 SDK 1.13.0：2020 年 7 月版本

注意

Windows 上的語音 SDK 取決於 Visual Studio 2015、2017 和 2019 的共用 Microsoft 適用於 Visual Studio 的 Visual C++ 可轉散發套件。請從這裡下載並安裝。

新功能

C#：已新增非同步對話謄寫支援。請參閱這裡的文件。
JavaScript：已新增對瀏覽器和 Node.js 的說話者辨識支援。
JavaScript：已新增對語言識別 / 語言識別碼的支援。請參閱這裡的文件。
Objective-C：已新增多裝置對話和對話謄寫支援。
Python：在 Windows 和 Linux 上新增適用於 Python 的壓縮音訊支援。請參閱這裡的文件。

錯誤修正

全部：已修正導致 KeywordRecognizer 在辨識之後不會向前移動串流的問題。
全部：已修正導致從 KeywordRecognitionResult 取得的串流不包括關鍵字的問題。
全部：已修正 SendMessageAsync 在使用者完成等候時，不會真的在網路上傳送訊息的問題。
全部：已修正當使用者呼叫 VoiceProfileClient::SpeakerRecEnrollProfileAsync 方法多次，且未等候呼叫完成時，說話者辨識 API 的當機。
全部：已修正在 VoiceProfileClient 和 SpeakerRecognizer 類別中啟用檔案記錄。
JavaScript：已修正瀏覽器最小化時節流的問題。
JavaScript：已修正串流記憶體流失的問題。
JavaScript：已新增從 Node.js 的 OCSP 回應快取。
JAVA：已修正導致 BigInteger 欄位永遠傳回 0 的問題。
iOS：已修正在 iOS 應用程式商店中發佈基於語音 SDK 應用程式的問題。

範例

C++：已新增說話者辨識的範例程式碼至這裡。

COVID-19 簡易測試

語音 SDK 1.12.1：2020 年 6 月版本

新功能

C#、C++：說話者辨識預覽：此功能可啟用說話者識別 (誰是說話者？) 和說話者驗證 (說話者是其所聲稱的身分嗎？)。從概觀開始，閱讀說話者辨識基本文章，或是 API 參考文件。

錯誤修正

C#、C++：已修正說話者辨識 1.12 版本中，麥克風錄製無法運作的問題。
JavaScript：針對 Firefox，以及在 macOS 和 iOS 上 Safari 中的文字轉換語音進行修正。
在使用八個通道的串流時，對話謄寫上 Windows 應用程式驗證器的存取違規當機修正程式。
在多裝置對話翻譯上 Windows 應用程式驗證器的存取違規當機修正程式。

範例

C#：說話者辨識的程式碼範例。
C++：說話者辨識的程式碼範例。
JAVA：Android 上意圖辨識的程式碼範例。

COVID-19 簡易測試

語音 SDK 1.12.0：2020 年 5 月版本

新功能

Go：新推出適用於語音辨識和自訂語音助理的 Go 語言支援。於這裡設定開發環境。如需範例程式碼，請參閱下面的「範例」一節。
JavaScript：已新增文字轉換語音的瀏覽器支援。請參閱這裡的文件。
C++、C#、JAVA：支援 Windows、Android、Linux 和 iOS 平台的新 KeywordRecognizer 物件和 API。請閱讀此處的文件。如需範例程式碼，請參閱下面的「範例」一節。
JAVA：已新增多裝置對話的翻譯支援。請參閱這裡的參考文件。

改善項目與最佳化

JavaScript：已最佳化瀏覽器麥克風實作，改善語音辨識的精確性。
JAVA：使用沒有 SWIG 的直接 JNI 執行重構的繫結。針對 Windows、Android、Linux 和 Mac 使用的所有 JAVA 套件，這項變更可減少 10 倍的繫結大小，並簡化語音 SDK Java 實作的進一步開發。
Linux：更新支援具有最新 RHEL 7 特定資訊的文件。
已改善連線邏輯，在發生服務和網路錯誤時嘗試連接多次。
已更新 portal.azure.com 語音快速入門頁面，協助開發人員在 Azure AI 語音旅程途中進行下一步驟。

錯誤修正

C#、JAVA：已修正 Linux ARM (32 位元和 64 位元) 載入 SDK 二進位檔案的問題。
C#：已修正 TranslationRecognizer、IntentRecognizer 和 Connection 物件原生控制代碼的明確處置。
C#：已修正 ConversationTranscriber 物件的音訊輸入存留期管理。
已修正從樣本片語辨識意圖時，未正確設定 IntentRecognizer 結果原因的問題。
已修正未正確設定 SpeechRecognitionEventArgs 結果位移的問題。
已修正 SDK 在開啟 websocket 連線之前嘗試傳送網路訊息的競爭條件。新增參與者的同時可重現 TranslationRecognizer。
已修正關鍵字辨識器引擎中的記憶體流失。

範例

Go：已新增語音辨識和自訂語音助理的快速入門。於這裡尋找範例程式碼。
JavaScript：已新增文字轉換語音、翻譯和意圖辨識的快速入門。
C# 和 JAVA (Android) 的關鍵字辨識範例。

COVID-19 簡易測試

語音 SDK 1.11.0：2020 年 3 月版本

新功能

Linux：已新增支援 Red Hat Enterprise Linux (RHEL) / CentOS 7 x64，搭配如何設定語音 SDK 系統的指示。
Linux：已新增 Linux ARM32 和 ARM64 上的 .NET Core C# 支援。您可以在這裡深入了解.
C#、C++：在 ConversationTranscriptionResult 已新增 UtteranceId，涵蓋所有中間和最後語音辨識結果的一致識別碼。 C# 和 C++ 的詳細資料。
Python：已新增 Language ID 支援。請參閱 GitHub 存放庫中的 speech_sample.py。
Windows：在所有 win32 主控台應用程式的 Windows 平台上新增壓縮的音訊輸入格式支援。如需更多詳細資料，請參考這裡。
JavaScript：支援 NodeJS 中的語音合成 (文字轉換語音)。在這裡深入了解。
JavaScript：新增新的 API，以啟用所有傳送和接收訊息的檢查。在這裡深入了解。

錯誤修正

C#、C++：已修正問題，因此 SendMessageAsync 現在會將二進位訊息傳送為二進位類型。 C# 和 C++ 的詳細資料。
C# 和 C++：已修正如果 Recognizer 在 Connection 物件前已處置，使用 Connection MessageReceived 事件可能造成當機。 C# 和 C++ 的詳細資料。
Android：來自麥克風的音訊緩衝區大小從 800 毫秒減少為 100 毫秒，以改善延遲。
Android：已修正 Android Studio 中 x86 Android 模擬器的問題。
JavaScript：已新增使用 fromSubscription API 支援中國區域。如需更多詳細資料，請參考這裡。
JavaScript：針對 NodeJS 的連線失敗，新增更多錯誤資訊。

範例

Unity：意圖辨識公用範例中 LUIS json 匯入失敗已修正。如需更多詳細資料，請參考這裡。
Python：為新增 Language ID 的範例。如需更多詳細資料，請參考這裡。

COVID-19 簡易測試：由於過去幾週的遠端工作，我們無法像往常一樣執行手動驗證測試。例如，我們無法測試 Linux、iOS 和 macOS 上的麥克風輸入和喇叭輸出。我們未進行任何可能造成這些平台錯誤的變更，並且全數通過我們的自動化測試。萬一我們遺漏了什麼，請在 GitHub 上告訴我們。
感謝您的持續支援。一如往常，請在 GitHub 或 Stack Overflow 張貼問題或意見反應。
保持身體健康！

語音 SDK 1.10.0：2020 年 2 月版本

新功能

已新增 Python 套件以支援 Python 新的 3.8 版本。
Red Hat Enterprise Linux (RHEL) / CentOS 8 x64 支援 (C++、C#、JAVA 和 Python)。

注意

客戶必須根據這些指示來設定 OpenSSL。
Linux ARM32 支援 Debian 和 Ubuntu。
DialogServiceConnector 現在支援 BotFrameworkConfig 上的選擇性「聊天機器人識別碼」參數。此參數可讓您使用多個 Direct Line Speech 聊天機器人搭配單一語音資源。如果未指定參數，則會使用 Direct Line Speech 通道設定頁面所決定的預設聊天機器人。
DialogServiceConnector 現在具有 SpeechActivityTemplate 屬性。 Direct Line Speech 將會使用此 JSON 字串的內容，在所有與 Direct Line Speech 聊天機器人交流的活動中預先填入各種支援的欄位，包括自動產生的活動，以回應像是語音辨識的事件。
TTS 現在會使用訂用帳戶金鑰進行驗證，以在建立合成器之後，減少第一個合成結果的第一個位元組延遲。
已更新 19 個地區設定的語音辨識模型，平均字錯率可減少 18.6% (es-ES、es-MX、fr-CA、fr-FR、it-IT、ja-JP、ko-KR、pt-BR、zh-CN、zh-HK、nb-NO、fi-FL、ru-RU、pl-PL、ca-ES、zh-TW、th-TH、pt-PT 和 tr-TR)。新模型會在多個網域中帶來顯著的改善，包括聽寫、客服中心轉錄和影片索引編制案例。

錯誤修正

已修正對話轉錄程式在 Java API 中未適當等候的 BUG
Xamarin GitHub issue 的 Android x86 模擬器修正程式
新增遺漏的 (Get|Set) 屬性方法至 AudioConfig
修正連線失敗時無法停止 audioDataStream 的 TTS BUG
使用不含區域的端點會造成對話翻譯工具的 USP 失敗
通用 Windows 應用程式中的識別碼產生現在會使用適當的唯一 GUID 演算法；它先前無意地預設為虛設常式的實作，這通常會在大型的互動集上產生衝突。

範例

使用 Speech SDK 搭配 Unity 麥克風和推送模式串流的 Unity 範例

其他變更

Linux 的 OpenSSL 設定文件已更新

語音 SDK 1.9.0：2020 年 1 月版本

新功能

多裝置對話：將多個裝置連線到相同的語音或文字型對話，並選擇性地翻譯對話之間傳送的訊息。在此文章中深入了解。
已新增 Android .aar 套件的關鍵字辨識支援，並已新增 x86 和 x64 類別支援。
Objective-C：SendMessage 和 SetMessageProperty 方法已新增至 Connection 物件。請參閱這裡的文件。
TTS C++ API 目前支援 std::wstring 作為合成文字輸入，在將需求傳遞給 SDK 之前，移除將 Wstring 轉換成字串的需求。請參閱此處的詳細資料。
C#：語言識別碼和來源語言組態現在可使用。
JavaScript：已新增功能至 Connection 物件，以傳遞來自語音服務的自訂訊息做為回呼 receivedServiceMessage。
JavaScript：已新增 FromHost API 支援，以簡化內部部署容器和主權雲端的使用。請參閱這裡的文件。
JavaScript：由於 orgads 的貢獻，我們目前接受 NODE_TLS_REJECT_UNAUTHORIZED。請參閱此處的詳細資料。

重大變更

OpenSSL 已更新為 1.1.1b 版本，並以靜態方式連結至適用於 Linux 的語音 SDK Core 程式庫。如果您的信箱 OpenSSL 尚未安裝至系統的 /usr/lib/ssl 目錄，可能會造成中斷。參閱語音 SDK 文件中的我們的文件，以解決問題。
我們已變更從 int 到 long 傳回 C# WordLevelTimingResult.Offset 的資料類型，當語音資料大於 2 分鐘，允許存取 WordLevelTimingResults。
PushAudioInputStream 和 PullAudioInputStream 現在會以 AudioStreamFormat 將 wav 標頭資訊傳送到語音服務，可於建立時選擇性地指定。客戶現在必須使用已支援的音訊輸入格式。任何其他格式都會產生並非最佳的辨識結果，或可能造成其他問題。

錯誤修正

請參閱上方重大變更中的 OpenSSL 更新。我們已修正在 Linux 和 JAVA 下的間歇性損毀和效能問題 (高負載下的鎖定競爭)。
JAVA：對高並行存取案例中的物件關閉進行改善。
已重新建構我們的 NuGet 套件。我們移除在 lib 資料夾下 Microsoft.CognitiveServices.Speech.core.dll 和 Microsoft.CognitiveServices.Speech.extension.kws.dll的三個複本，讓 NuGet 套件更小且下載更快速，而且我們已新增編譯一些 C++ 原生應用程式所需的標頭。
請參閱這裡的已修正快速入門範例。在 Linux、macOS 和 Windows 上，這些都不會顯示「找不到麥克風」的例外狀況。
已修正在特定程式碼路徑 (例如此範例) 上，具有長語音辨識結果的 SDK 結果的當機。
已修正 Azure Web 應用程式環境中的 SDK 部署錯誤，以解決此客戶的問題。
已修正使用多 <voice> 標記或 <audio> 標記的TTS 錯誤，以解決此客戶的問題。
已修正 SDK 從暫停中復原時的 TTS 401 錯誤。
JavaScript：由於 euirim 的貢獻，已修正音訊資料的迴圈匯入。
JavaScript：已新增設定服務屬性的支援，如同 1.7 版本中所新增。
JavaScript：已修正連線錯誤可能導致連續失敗的 websocket 重新連線嘗試的問題。

範例

已新增 Android 關鍵字辨識範例至這裡。
已新增伺服器情節的 TTS 範例至這裡。
已新增 C# 和 C++ 的多裝置對話快速入門至這裡。

其他變更

已最佳化 Android 上 SDK 核心程式庫的大小。
SDK 1.9.0 版本開始支援對話謄寫器中語音簽章版本欄位的 int 和 string 類型。

語音 SDK 1.8.0：2019 年 11月版本

新功能

已新增 FromHost() API，以簡化內部部署容器和主權雲端的使用。
已新增語音辨識 (JAVA 和 C++) 的來源語言識別
已新增語音辨識的 SourceLanguageConfig 物件，用於指定預期的來源語言 (JAVA 和 C++)
已透過 NuGet 和 Unity 套件新增 Windows (UWP)、Android 和 iOS 的 KeywordRecognizer 支援
已新增遠端對話 Java API，以非同步批次進行對話謄寫。

重大變更

對話謄寫器的功能已移至命名空間下 Microsoft.CognitiveServices.Speech.Transcription。
對話轉義氣方法的元件會移至新的 Conversation 類別。
已中斷支援 32 位元 (ARMv7 和 x86) iOS

錯誤修正

如果未使用有效的語音服務訂用帳戶金鑰執行本地 KeywordRecognizer，所產生的當機修正程式

範例

KeywordRecognizer 的 Xamarin 範例
KeywordRecognizer 的 Unity 範例
自動來源語言識別的 C++ 和 JAVA 範例。

語音 SDK 1.7.0：2019 年 9 月版本

新功能

已於通用 Windows 平台 (UWP)、Android 和 iOS 上新增搶鮮版 (Beta) 支援 Xamarin
已新增 Unity 的 iOS 支援
針對 Android、iOS 和 Linux 上的 ALaw、Mulaw、FLAC 新增 Compressed 輸入支援
已新增 SendMessageAsync 至 Connection 類別，以傳送訊息到服務
已新增 SetMessageProperty 至 Connection 類別，以設定訊息的屬性
TTS 已新增 JAVA (JRE 和 Android)、Python、Swift 和 Objective-C 的資料繫結
TTS 已新增 macOS、iOS 和 Android 的播放支援。
已新增 TTS 的「字邊界」資訊。

錯誤修正

已修正 Android 的 Unity 2019 IL2CPP 編譯問題
已修正 wav 檔案輸入中格式錯誤的標頭未正確處理的問題
已修正某些連線屬性中 UUID 不是唯一的問題
已修正 Swift 繫結 (可能需要變更少量的程式碼) 中的可 NULL 性指定名稱的一些警告
已修正在網路負載下導致 websocket 連線強制關閉的 BUG
已修正 Android 上的問題，該問題有時會導致複製 DialogServiceConnector 使用的印象識別碼
當發生 DialogServiceConnector 時，改善跨多重回合互動的連線穩定性以及失敗報告 (透過 Canceled 事件)
DialogServiceConnector 工作階段啟動將會正確提供事件，包括在使用中的 StartKeywordRecognitionAsync() 期間呼叫 ListenOnceAsync()
已解決與已接收 DialogServiceConnector 活動有關的當機

範例

Xamarin 快速入門
以 Linux ARM64 資訊更新 CPP 快速入門
以 iOS 資訊更新 Unity 快速入門

語音 SDK 1.6.0：2019 年 6 月版本

範例

UWP 和 Unity 上文字轉換語音的快速入門範例
iOS 上 Swift 的快速入門範例
Unity 範例，適用於語音與意圖辨識和翻譯
已更新 DialogServiceConnector 的快速入門範例

/變更

對話方塊命名空間：
- SpeechBotConnector 已重新命名為 DialogServiceConnector
- BotConfig 已重新命名為 DialogServiceConfig
- BotConfig::FromChannelSecret()已重新對應至 DialogServiceConfig::FromBotSecret()
- 重新命名之後，仍會繼續支援所有現有的 Direct Line Speech 用戶端
更新 TTS REST 配接器以支持 proxy 和持續連線
通過不正確的區域時改善錯誤訊息
Swift/Objective-C：
- 已改善的錯誤報表：可能導致錯誤的方法現在會出現在兩個版本中：一個會公開處理錯誤的 NSError 物件，另一個則會引發例外狀況。前者已公開至 Swift。這種變更需要採用現有的 Swift 程式碼。
- 已改善的事件處理

錯誤修正

TTS 修正程式：SpeakTextAsync 未來傳回但未等候音訊已完成謄寫的情況
C# 中的封送處理字串以啟用完整語言支援的修正程式
.NET Core 應用程式問題，以使用 net461 目標架構在範例中載入核心程式庫的修正程式
將原生程式庫部署至範例中輸出檔案夾出現偶爾問題的修正程式
可靠地關閉 web 通訊端的修正程式
在 Linux 負載過重下開啟連線時可能損毀問題的修正程式
macOS 架構套件組合中遺失的中繼資料修正程式
Windows 上 pip install --user 問題的修正程式

語音 SDK 1.5.1

這是 BUG 修正版本，只會影響原生 / 受控 SDK。不會影響 JavaScript 版本的 SDK。

錯誤修正

修正搭配對話謄寫使用時的 FromSubscription。
修正語音助理找出關鍵字中的 BUG。

語音 SDK 1.5.0：2019 年 5 月版本

新功能

找出關鍵字 (KWS) 目前適用於 Windows 和 Linux。 KWS 功能可能適用於任何麥克風類型、官方 KWS 支援，但目前僅限於 Azure Kinect DK 硬體或語音裝置 SDK 中的麥克風陣列。
片語提示功能可透過 SDK 取得。如需詳細資訊，請參閱此處。
您可以透過 SDK 取得對話謄寫功能。
新增使用 Direct Line Speech 通道對語音助理的支援。

範例

已新增 SDK 所支援的新功能或新服務的範例。

/變更

已新增各種辨識器屬性來調整服務行為或服務結果 (例如遮罩不雅的內容和其他)。
您現在可以透過標準設定屬性來設定辨識器，即使您已建立辨識器 FromEndpoint。
Objective-C：新增 OutputFormat 屬性到 SPXSpeechConfiguration。
SDK 目前支援 Debian 9 作為 Linux 發行版。

錯誤修正

已修正文字轉換語音中說話者資源過早解構的問題。

語音 SDK 1.4.2

這是 BUG 修正版本，只會影響原生 / 受控 SDK。不會影響 JavaScript 版本的 SDK。

語音 SDK 1.4.1

這是僅限 JavaScript 的版本。未新增任何功能。已進行下列修正：

防止網頁套件載入 https-proxy-agent。

語音 SDK 1.4.0：2019年 4 月版本

新功能

SDK 搶鮮版 (Beta) 目前支援文字轉換語音服務。 Windows 和 Linux 桌面 C++ 和 C# 都支援此服務。如需詳細資訊，請參閱文字轉換語音概觀。
SDK 目前支援 MP3 和 Opus/OGG 音訊檔案作為串流輸入檔。這項功能僅適用於 Linux 上的 C++ 和 C#，且目前為搶鮮版 (Beta) (更多詳細資料，請前往這裡)。
JAVA、.NET Core、C++ 和 Objective-C 的語音 SDK 已獲得 macOS 支援。 macOS 的 Objective-C 支援目前為搶鮮版 (Beta)。
iOS：iOS (Objective-C) 的語音 SDK 現在也發佈為 CocoaPod。
JavaScript：支援非預設的麥克風作為輸入裝置。
JavaScript：Proxy 支援 Node.js。

範例

已在 macOS 上新增使用搭配 Objective-C 和 C++ 的語音 SDK 範例。
已新增示範如何使用文字轉換語音服務的範例。

/變更

Python：辨識結果的其他屬性現在會透過 properties 屬性公開。
如需其他開發和偵錯工具支援，您可以將 SDK 記錄和診斷資訊重新導向至記錄檔 (更多詳細資料，請看這裡)。
JavaScript：改善音訊處理效能。

錯誤修正

Mac/iOS：已修正無法建立語音服務連線時，導致等候時間過長的 BUG。
Python：改善 Python 回撥中引數的錯誤處理。
JavaScript：已修正在 RequestSession 上結束語音的錯誤狀態報表。

語音 SDK 1.3.1：2019 年 2 月更新版本

這是 BUG 修正版本，只會影響原生 / 受控 SDK。不會影響 JavaScript 版本的 SDK。

錯誤 (bug) 修正

已修正使用麥克風輸入時的記憶體流失。以串流為基礎或檔案輸入不受影響。

語音 SDK 1.3.0：2019 年 2 月版本

新功能

語音 SDK 支援透過 AudioConfig 類別來選取輸入麥克風。這可讓音訊資料從非預設麥克風串流到語音服務。如需詳細資訊，請參閱說明音訊輸入裝置選取的文件。此功能還無法在 JavaScript 中使用。
語音 SDK 現在支援搶鮮版 (Beta) Unity。請透過 GitHub 範例存放庫中的問題一節提供意見反應。此版本可在 Windows x86 和 x64 (桌面或通用 Windows 平台應用程式) 以及 Android (ARM32/64、x86) 上支援 Unity。詳情請參閱 Unity 快速入門。
不再需要 Microsoft.CognitiveServices.Speech.csharp.bindings.dll 檔案 (已於先前版本中寄送)。這項功能現已整合到 Core SDK 中。

範例

範例存放庫有提供下列新內容：

AudioConfig.FromMicrophoneInput 的其他範例。
額外的 Python 範例，適用於意圖辨識和翻譯。
在 iOS 中使用 Connection 物件的額外範例。
額外的 Java 範例，適用於以音訊輸出進行翻譯。
批次轉譯 REST API 的新使用範例。

/變更

Python
- 已改善 SpeechConfig 中的參數驗證及錯誤訊息。
- 新增 Connection 物件的支援。
- 支援在 Windows 上使用 32 位元的 Python (x86)。
- 適用於 Python 的語音 SDK 已不再是搶鮮版 (Beta)。
iOS
- SDK 現在是根據 iOS SDK 12.1 版來建置。
- SDK 現在支援 iOS 9.2 版和更新版本。
- 改善參考文件，並修正數個屬性名稱。
JavaScript
- 新增 Connection 物件的支援。
- 為配套的 JavaScript 新增了類型定義檔
- 初次支援和實作片語提示。
- 傳回含有服務 JSON 的屬性集合以供辨識
Windows DLL 現在會包含版本資源。
如果您建立識別器 FromEndpoint，您可以直接將參數新增至端點 URL。使用 FromEndpoint 時，您無法透過標準設定屬性來設定辨識器。

錯誤修正

空的 Proxy 使用者名稱和 Proxy 密碼之前不會正確處理。在此版本中，如果您將 Proxy 使用者名稱和 Proxy 密碼設定為空字串，系統將不會在連線到 Proxy 時提交出去。
在某些語言 / 環境中，SDK 所建立的 SessionId 並不一定是真正隨機。已新增亂數產生器初始化來修正此問題。
改善授權權杖的處理方式。如果您想要使用授權權杖，請在 SpeechConfig 中指定，並讓訂用帳戶金鑰保持空白。然後如往常般建立辨識器。
在某些情況下，Connection 物件未正確發行。已修正此問題。
JavaScript 範例已修正，現在也能夠在 Safari 上支援以音訊輸出合成翻譯。

語音 SDK 1.2.1

這是僅限 JavaScript 的版本。未新增任何功能。已進行下列修正：

會在 turn.end 而非 speech.end 引發資料流的結束。
修正音訊幫浦中的 BUG，此 BUG 會導致系統未在目前的傳送失敗時排程下一次傳送。
修正使用驗證權杖來進行的連續辨識。
修正不同辨識器/端點的 BUG。
文件改進。

語音 SDK 1.2.0：2018 年 12 月版本

新功能

Python
- 這一版提供 Python 支援的搶鮮版 (Beta) (3.5 和更新版本)。如需詳細資訊，請參閱[此處](../../quickstart-python.md)。
JavaScript
- 適用於 JavaScript 的語音 SDK 已開放原始碼。原始程式碼可在 GitHub 中取得。
- 我們現在支援 Node.js，您可以在這裡找到更多資訊。
- 音訊工作階段的長度限制已移除，重新連線會自動發生。
Connection 物件
- 從 Recognizer，您可以存取 Connection 物件。此物件可讓您明確地起始服務連線，並訂閱連線和中斷連線事件。 (此功能還無法在 JavaScript 和 Python 中使用。)
Ubuntu 18.04 支援。
Android
- 已在 APK 產生期間啟用 ProGuard 支援。

改善

改進內部執行緒使用方式，並減少執行緒、鎖定、Mutex 的數目。
已改善錯誤回報 / 資訊。在有些情況下，錯誤訊息尚未完全傳播出去。
已將 JavaScript 中的開發相依性更新為使用最新的模組。

錯誤修正

已修正由於 RecognizeAsync 中類型不符所造成的記憶體流失。
在某些情況下，例外狀況正在流失。
已修正翻譯事件引數的記憶體流失。
已修正在長時間執行的工作階段中重新連線的鎖定問題。
已修正因為翻譯失敗而可能導致遺漏最終結果的問題。
C#：如果 async 作業未在主執行緒中等候，則在非同步工作完成之前，就可能處置了辨識器。
JAVA：已修正導致 JAVA VM 損毀的問題。
Objective-C：已修正列舉對應；傳回了 RecognizedIntent 而不是 RecognizingIntent。
JavaScript：在 SpeechConfig 中將預設輸出格式設定為「simple」。
JavaScript：移除 JavaScript 與其他語言中組態物件屬性之間的不一致。

範例

已更新和修正數個範例 (例如可供翻譯的輸出語音等)。
已在範例存放庫中新增 Node.js 範例。

語音 SDK 1.1.0

新功能

支援 Android x86/x64。
Proxy 支援：您現在可以在 SpeechConfig 物件中呼叫函式來設定 Proxy 資訊 (主機名稱、連接埠、使用者名稱和密碼)。此功能尚無法在 iOS 上取得。
改善的錯誤碼和訊息。如果辨識傳回錯誤，系統現在會將 Reason (在取消的事件中) 或 CancellationDetails (在辨識結果中) 設為 Error。取消的事件現在包含兩個額外的成員，ErrorCode 和 ErrorDetails。如果伺服器隨報告的錯誤傳回其他錯誤資訊，現在將可以透過新成員取得這些資訊。

改善

已在辨識器設定中新增其他驗證，及新增其他錯誤訊息。
已改善對音訊檔案中長時間無聲之部分的處理。
NuGet 套件：針對 .NET Framework 專案，其可防止使用 AnyCPU 設定來建置。

錯誤修正

已修正在辨識器中找到的幾個例外狀況。此外，系統會攔截例外狀況，並轉換成 Canceled 事件。
修正屬性管理中的記憶體流失。
已修正音訊輸入可能會損毀辨識器的錯誤。
已修正工作階段將事件停止之後，仍然可收到事件的錯誤。
已修正執行緒中的一些競爭條件。
已修正可能會導致當機的 iOS 相容性問題。
已改善對 Android 麥克風支援的穩定性。
已修正 JavaScript 中的辨識器會忽略辨識語言的錯誤。
已修正 JavaScript 中 (在某些情況下) 會防止設定 EndpointId 的 BUG。
已變更 JavaScript 中 AddIntent 內參數的順序，並已新增遺失的 AddIntent JavaScript 簽章。

範例

已在範例存放庫中新增可供提取和推送資料流使用方式的 C++ 和 C# 範例。

語音 SDK 1.0.1

穩定性改進及 Bug 修正：

已修正處置辨識器時因競爭條件而可能導致的嚴重錯誤
已修正未設定屬性時可能導致的嚴重錯誤。
已新增額外的錯誤和參數檢查。
Objective-C：已修正因 NSString 中的名稱覆寫而可能導致的嚴重錯誤。
Objective-C：已調整 API 的可見性
JavaScript：已修正有關事件及其承載的問題。
文件改進。

在我們的範例存放庫中，已新增新的 JavaScript 範例。

Azure AI 語音 SDK 1.0.0：2018 年 9 月版本

新功能

iOS 上對 Objective-C 的支援。請參閱我們的適用於 iOS 的 Objective-C 快速入門。
瀏覽器中對 JavaScript 的支援。請參閱我們的 JavaScript 快速入門。

重大變更

此版本引進了幾個重大變更。如需詳細資訊，請參閱此頁面。

Azure AI 語音 SDK 0.6.0：2018 年 8 月版本

新功能

使用語音 SDK 所建置的 UWP 應用程式現在可以通過 Windows 應用程式認證套件 (WACK) 的認證。請參閱 UWP 快速入門。
在 Linux (Ubuntu 16.04 x64) 上支援 .NET Standard 2.0。
實驗性：在 Windows (64 位元) 和 Linux (Ubuntu 16.04 x64) 上支援 Java 8。請參閱 Java 執行階段環境快速入門。

功能性變更

公開關於連線錯誤的其他錯誤詳細資訊。

重大變更

在 Java (Android) 上，SpeechFactory.configureNativePlatformBindingWithDefaultCertificate 函式不再需要路徑參數。系統現在會自動在所有支援平台上偵測路徑。
Java 和 C# 中 EndpointUrl 屬性的 get-accessor 已移除。

錯誤修正

在 Java 中，現已實作翻譯辨識器上的音訊合成結果。
已修正錯誤，此錯誤可能導致非作用中的執行緒，並增加已開啟且未使用的通訊端數目。
已修正問題，長時間執行的辨識可能會在傳輸途中終止。
已修正辨識器關機中的競爭條件。

Azure AI 語音 SDK 0.5.0：2018 年 7 月版本

新功能

支援 Android 平台 (API 23: Android 6.0 Marshmallow 或更新版本)。請參閱 Android 快速入門。
在 Windows 上支援 .NET Standard 2.0。請參閱 .NET Core 快速入門。
實驗性：在 Windows 上支援 UWP (1709 版或更新版本)。
- 請參閱 UWP 快速入門。
- 注意：使用語音 SDK 建置的 UWP 應用程式尚未通過 Windows 應用程式認證套件 (WACK) 的認證。
使用自動重新連線支援長時間執行辨識。

功能性變更

StartContinuousRecognitionAsync() 支援長時間執行辨識。
辨識結果包含更多欄位。它們從已辨識文字的音訊開頭和持續時間 (兩者都以刻度為單位)，以及表示辨識狀態的其他值位移，例如 InitialSilenceTimeout 和 InitialBabbleTimeout。
支援 AuthorizationToken 以建立處理站執行個體。

重大變更

辨識事件：NoMatch 事件類型已合併到 Error 事件中。
C# 中的 SpeechOutputFormat 已重新命名為 OutputFormat，以便與 C++ 保持一致。
AudioInputStream 介面部分方法的傳回型別已稍微變更：
- 在 Java 中，read 方法現在會傳回 long 而不是 int。
- 在 C# 中，Read 方法現在會傳回 uint 而不是 int。
- 在 C++ 中，Read 和 GetFormat 方法現在會傳回 size_t 而不是 int。
C++：音訊輸入串流的執行個體現在只能當作 shared_ptr 傳遞。

錯誤修正

修正 RecognizeAsync() 逾時的時候，結果中不正確的傳回值。
已移除 Windows 上媒體基礎程式庫的相依性。 SDK 現在使用核心音訊 API。
文件修正：已新增區域頁面來描述支援的區域。

已知問題

適用於 Android 的語音 SDK 不會回報用於翻譯的語音合成結果。此問題將在下一版中修正。

Azure AI 語音 SDK 0.4.0：2018 年 6 月版本

功能性變更

AudioInputStream

辨識器現在可以取用資料流作為音訊來源。如需詳細資訊，請參閱相關的操作說明指南。
詳細的輸出格式

建立 SpeechRecognizer 時，您可以要求 Detailed 或 Simple 輸出格式。 DetailedSpeechRecognitionResult 包含信賴分數、已辨識的文字、未經處理的語彙形式，以及標準化形式和加上遮罩的粗話。

重大變更

在 C# 中已從 SpeechRecognitionResult.RecognizedText 變更為 SpeechRecognitionResult.Text。

錯誤修正

已修正在關閉期間 USP 層中可能發生的回呼問題。
如果辨識器取用音訊輸入檔，其保留檔案控制代碼超過所需的時間。
已移除訊息幫浦與辨識器之間的數個死結。
如果來自服務的回應逾時，則引發 NoMatch。
Windows 上的媒體基礎程式庫延遲載入。只有麥克風輸入需要此程式庫。
音訊資料的上傳速度受限於大約兩倍的原始音訊速度。
在 Windows 上，C# .NET 組件現在使用強式名稱。
文件修正：Region 是建立辨識器時所需的資訊。

已新增更多範例，且持續更新。如需最新的範例集，請參閱語音 SDK 範例 GitHub 存放庫 \(英文\)。

Azure AI 語音 SDK 0.2.12733：2018 年 5 月版本

此版本為 Azure AI 語音 SDK 的第一個公開預覽版本。

語音 CLI 1.38.0：2024 年 6 月版本

已更新為使用語音 SDK 1.38.0

新功能

none

錯誤修正

none

語音 CLI 1.37.0：2024 年 4 月版本

已更新為使用語音 SDK 1.37.0

新功能

none

錯誤修正

none

語音 CLI 1.36.0：2024 年 3 月版本

已更新為使用語音 SDK 1.36.0

新功能

none

錯誤修正

none

語音 CLI 1.35.0：2024 年 2 月版本

已更新為使用語音 SDK 1.35.0

新功能

none

錯誤修正

JMESPath 相依性已更新為最新

語音 CLI 1.34.0：2023 年 11 月版本

已更新為使用語音 SDK 1.34.0

語音 CLI 1.33.0：2023 年 10 月版本

已更新為使用語音 SDK 1.34.0

語音 CLI 1.31.0：2023 年 8 月版本

已更新為使用語音 SDK 1.31.0

語音 CLI 1.30.0：2023 年 7 月版本

已更新為使用語音 SDK 1.30.0

語音 CLI 1.29.0：2023 年 6 月版本

已更新為使用語音 SDK 1.29.0

語音 CLI 1.28.0：2023 年 5 月版本

已更新為使用語音 SDK 1.28.0

語音 CLI 1.27.0：2023 年 4 月版本

更新

已更新為使用語音 SDK 1.27.0
更新預設端點，以針對自訂語音辨識和批次語音辨識使用 v3.1 REST API。

錯誤修正

與如何剖析/設定查詢參數相關的修正程式。

語音 CLI 1.26.0：2023 年 3 月版本

已更新為使用語音 SDK 1.26.0。

語音 CLI 1.25.0：2023 年 1 月版本

已更新為使用語音 SDK 1.25.0。

語音 CLI 1.24.0：2022 年 10 月版本

使用語音 SDK 1.24.0。

新功能

展開「spx 檢查」以支援所有 spx 事件的 JMESPath 查詢

錯誤修正

對 JMESPath 查詢評估的健全性進行各種改善
修正在資源限制電腦上可能發生的檔案寫入截斷

語音 CLI 1.23.0：2022 年 7 月版本

使用語音 SDK 1.23.0。

新功能

改善字幕 (--output vtt 和 --output srt) 大型結果分割 (最多 37 個字元，3 行)
已記載 spx synthesize--format 選項 (請參閱 spx help synthesize format)
已記載大部分 spx csr 命令/選項 (請參閱 spx help csr)
已新增 spx csr model copy 命令 (請參閱 spx help csr model copy)
已使用 JMES 查詢新增 --check result 選項 (請參閱 spx help check result)
已改善指定不正確命令選項時的錯誤訊息
已從 .NET Core 3.1 移至 .NET 6.0。若要執行語音 CLI，您必須安裝 .NET 6.0 執行階段 (或更新版本)。

錯誤修正

已更新所有 URL 以移除語言 (例如「en-US」)
已修正版本資訊，以便在所有情況下適當地回報 (先前有時會顯示空白)

語音 CLI 1.22.0：2022 年 6 月版本

使用語音 SDK 1.22.0。

新功能

已新增 spx init 命令，以引導使用者建立「語音」資源索引鍵，而不需要前往 Azure 入口網站。
語音 Docker 容器現已包含 Azure CLI，因此 spx init 命令立即可用。
已將時間戳記新增為事件輸出選項，讓 SPX 在計算延遲時更有用。

語音 CLI 1.21.0：2022 年 4 月版本

使用語音 SDK 1.21.0。

新功能

產生 WEBVTT 字幕
- 已將 --output vtt 支援新增至 spx translate
- 支援 --output vtt file FILENAME 覆寫預設的 VTT FILENAME
- 支援 --output vtt file - 寫入標準輸出
- 系統會為每個目標語言建立個別 VTT 檔案 (例如 --target en;de;fr)
產生 SRT 字幕
- 已新增 spx recognize、spx intent 和 spx translate 對 --output srt 的支援
- 支援 --output srt file FILENAME 覆寫預設的 SRT FILENAME
- 支援 --output srt file - 寫入標準輸出
- 系統會針對 spx translate 為每個目標語言建立個別 SRT 檔案 (例如 --target en;de;fr)

錯誤修正

已更正 WEBVTT 時間範圍輸出以正確使用 hh:mm:ss.fff 格式

語音 CLI 1.20.0：2022 年 1 月版本

新功能

說話者辨識
- spx profile enroll 和 spx speaker [identify/verify] 現可支援麥克風輸入
意圖辨識 (spx intent)
- --keyword FILE.table
- --pattern 和 --patterns
- --output all/each intentid
- --output all/each entity json
- --output all/each ENTITY entity
- --once、--once+、--continuous (預設現為 continuous)
- --output all/each connection EVENT
- --output all/each connection message (例如，text、path)
CLI 主控台輸出預期檢查/撰寫：
- 所有命令皆支援 --expect PATTERN 和 --not expect PATTERN
- --auto expect 以協助製作預期的模式
SDK 記錄輸出預期檢查/製作
- 所有命令皆支援 --log expect PATTERN 和 --not log expect PATTERN
- 所有命令皆支援 --log auto expect [FILTER]
- spx profile 和 spx speaker 皆支援 --log FILE
音訊檔案輸入
- 所有命令皆支援 --format ANY
- 支援 --file - (讀取自標準輸入，啟用管道案例)
音訊檔案輸出
- --audio output - 寫入至標準輸出，啟用管道案例
輸出檔案
- --output all/each file - 寫入至標準輸出
- --output batch file - 寫入至標準輸出
- --output vtt file - 寫入至標準輸出
- --output json file - 寫入至標準輸出，適用於 spx csr 和 spx batch 命令
輸出屬性
- --output […] result XXX property (PropertyId 或字串)
- --output […] connection message received XXX property (PropertyId 或字串)
- --output […] recognizer XXX property (PropertyId 或字串)
Azure WebJob 整合
- spx webjob 現會遵循子命令模式
- 已更新 WebJob 說明以反映子命令模式 (請參閱 spx help webjob)

錯誤修正

已修正同時使用 --output vtt FILE 和 --output batch FILE 時發生的 Bug
spx [...] --zip ZIPFILENAME 現已包含所有案例所需的所有二進位檔 (如有)
spx profile 和 spx speaker 命令現於取消時會傳回詳細錯誤資訊

2021 年 5 月版本

新功能

已新增對設定檔、說話者識別碼和說話者驗證的支援 - 請從命令列嘗試執行 spx profile 和 spx speaker。
我們也新增對話方塊支援 - 請從命令列嘗試執行 spx dialog。
改善 spx 的說明。您可以藉由開啟 GitHub 問題，提供意見反應給我們，以了解是否對您有所幫助。
我們已減少 .NET 工具安裝的大小。

COVID-19 簡易測試

由於目前延燒的全球疫情會持續迫使我們的工程師在家工作，疫情爆發前常用的手動驗證指令碼已大幅減少。我們會使用較少的設定來測試較少的裝置，錯過環境特有 BUG 的可能性會增加。我們仍以大量自動化的方式進行嚴格的驗證。萬一我們遺漏了什麼，請在 GitHub 上告訴我們。
保持身體健康！

2021 年 3 月版本

新功能

已新增意圖辨識的 spx intent 命令，取代 spx recognize intent。
辨識和意圖現在可以使用 spx recognize --wer url <URL> Azure 函式來計算字錯率。
辨識現在可以像 VTT 檔案使用 spx recognize --output vtt file <FILENAME> 輸出結果。
敏感性金鑰資訊現在會在 debug/verbose 輸出中隱藏。
已針對批次謄寫中建立的內容欄位新增 URL 檢查和錯誤訊息。

COVID-19 簡易測試

2021 年 1 月版本

新功能

語音 CLI 現在以 NuGet 套件的形式提供，可透過 .NET CLI 安裝為可從殼層/命令列呼叫的 .NET 通用工具。
自訂語音 DevOps 範本存放庫已更新，以對其自訂語音工作流程使用語音 CLI。

COVID-19 簡易測試

2020 年 10 月版本

SPX 是無須撰寫程式碼的情況下，使用語音服務的命令列介面。於這裡下載最新版本。

新功能

spx csr dataset upload --kind audio|language|acoustic - 從本地資料建立資料集，而不是只從 URL。
spx csr evaluation create|status|list|update|delete – 比較新的模型與真實基準 / 其他模型。
spx * list – 支援非分頁體驗 (不需要--top X--skip X)。
spx * --http header A=B– 支援自訂標頭 (已新增自訂驗證的 Office)。
spx help – 已改善的文字和反引號文字色彩編碼 (藍色)。

2020 年 6 月版本

已新增 CLI 的說明搜尋功能：
- spx help find --text TEXT
- spx help find --topic NAME
已更新為使用新部署的 v3.0 批次和自訂語音 API：
- spx help batch examples
- spx help csr examples

COVID-19 簡易測試

語音 CLI (也稱為 SPX)：2020 年 5 月版本

SPX 是一種新的命令列工具，可讓您從命令列執行辨識、合成、翻譯、批次謄寫和管理自訂語音。您可以用其來測試語音服務，或編寫您需要執行的語音服務工作指令碼。下載工具並於這裡閱讀文件。

2024 年 6 月版本

預建神經語音

在特定區域中推出 6 個新的公開預覽語音：東亞、東南亞、美國東部、美國西部和印度中部。

地區設定	語言	文字轉換語音的語音
`or-IN`	歐利亞文 (印度)	`or-IN-SubhasiniNeural` (女性)
`or-IN`	歐利亞文 (印度)	`or-IN-SukantNeural` (男性)
`pa-IN`	旁遮普文 (印度)	`pa-IN-VaaniNeural` (女性)
`pa-IN`	旁遮普文 (印度)	`pa-IN-OjasNeural` (男性)
`as-IN`	阿薩姆文 (印度)	`as-IN-YashicaNeural` (女性)
`as-IN`	阿薩姆文 (印度)	`as-IN-PriyomNeural` (男性)

如需詳細資訊，請參閱完整語言和語音清單。

文字轉換語音虛擬人偶

文字轉換語音虛擬人偶現在支援下列區域：東南亞、北歐、西歐、瑞典中部、美國中南部和美國西部 2。如需詳細資訊，請參閱語音服務區域。

5 月 (2024) 版本

個人版語音 (GA)

個人版語音現已正式推出。有了個人版語音，您可以在幾秒鐘內取得 AI 對您的 (或應用程式使用者的) 語音生成的復寫。您提供一分鐘的語音樣本做為音訊提示，然後系統便可使用樣本來生成 100 多個地區設定支援的任何 90 多種語言的語音。如需詳細資訊，請參閱個人版語音概觀。

預建神經語音

在公開預覽版中引進 8 個新的多語種語音：en-GB-AdaMultilingualNeural、en-GB-OllieMultilingualNeural、es-ES-ArabellaMultilingualNeural、es-ES-IsidoraMultilingualNeural、it-IT-AlessioMultilingualNeural、it-IT-IsabellaMultilingualNeural、it-IT-MarcelloMultilingualNeural 和 pt-BR-ThalitaMultilingualNeural。如需詳細資訊，請參閱完整語言和語音清單。
在公開預覽版中引進針對話務中心案例最佳化的 2 個新的 en-US 語音：en-US-LunaNeural 和 en-US-KaiNeural。如需詳細資訊，請參閱完整語言和語音清單。

2024 年 4 月版本

文字轉換語音虛擬人偶

您現在可以為虛擬人偶設定靜態背景影像。若要利用這項功能，只需使用 avatarConfig.backgroundImage 屬性，並指定指向所需影像的 URL。如需詳細資訊，請參閱如何編輯背景。

2024 年 3 月版本

預建神經語音

所有區域中都有 9 個多語系語音：en-US-AvaMultilingualNeural、en-US-AndrewMultilingualNeural、en-US-EmmaMultilingualNeural、en-US-BrianMultilingualNeural、de-DE-FlorianMultilingualNeural、de-DE-SeraphinaMultilingualNeural、fr-FR-RemyMultilingualNeural、fr-FR-VivienneMultilingualNeural 和 zh-CN-XiaoxiaoMultilingualNeural。如需詳細資訊，請參閱完整語言和語音清單。
推出新的多語系語音以進行公開預覽：ja-JP-MasaruMultilingualNeural 如需詳細資訊，請參閱完整語言和語音清單。
其他更新：
- en-US-RyanMultilingualNeural 已在所有區域正式推出。
- en-US-JennyMultilingualV2Neural 已在所有區域中正式推出 (與 en-US-JennyMultilingualNeural 合併)。
- 推出已更新的 en-IN-NeerjaNeural 和 hi-IN-SwaraNeural 預覽，其中美國東部、西歐和東南亞有 3 個新樣式。
- 適用於印度中部的新女聲預覽：en-IN-KavyaNeural、en-IN-AnanyaNeural、en-IN-AashiNeural、hi-IN-KavyaNeural 和 hi-IN-AnanyaNeural。

文字轉換語音虛擬人偶

已移除適用於即時虛擬人偶的 Azure 通訊服務 (ACS) TURN 的相依性。範例程式碼已據此更新，以反映這項變更。
已發佈文字轉換語音虛擬人偶定價。如需詳細資訊，請參閱定價頁面。請注意，只有提供此功能的服務區域才會看到虛擬人偶定價。

2024 年 2 月版本

OpenAI 語音

Azure AI 語音服務支援下列區域中的 OpenAI 文字轉換語音：美國中北部和瑞典中部。如同 Azure AI 語音，OpenAI 文字轉換語音會提供高品質的語音合成，以將書面文字轉換為自然發音的音訊。這為沉浸式和互動式使用者體驗帶來了廣泛的可能性。如需詳細資訊，請參閱什麼是 OpenAI 文字轉換語音？。

注意

Azure OpenAI 服務中也提供 OpenAI 文字轉換語音功能。
透過此更新，我們調整了使用 Azure AI 語音的預先建置神經語音的定價。請在此處查看更新後的定價。

個人版語音

個人版語音功能現在支援 DragonLatestNeural 和 PhoenixLatestNeural 模型。這些新模型增強了合成語音的自然性，更能與提示中語音的語音特徵相同。如需詳細資訊，請參閱在應用程式中整合個人版語音。

2023 年 12 月版本

自訂語音 API

自訂語音 API 可用於建立和管理專業以及個人自訂神經語音模型。

自訂神經語音

新定型的語音模型現在支援 48 kHz 採樣速率 (不論模型版本為何)。針對先前定型的語音模型，必須至少將引擎版本升級至 2023.11.13.0 版本，以將採樣速率提升至 48 kHz。

預建神經語音

推出新的多語系語音以進行公開預覽：

地區設定 (BCP-47)	語言	文字轉換語音的語音
`de-DE`	德文 (德國)	`de-DE-FlorianMultilingualNeural` (男性)
`de-DE`	德文 (德國)	`de-DE-SeraphinaMultilingualNeural` (女性)
`en-US`	英文 (美國)	`en-US-AvaMultilingualNeural` (女性)
`en-US`	英文 (美國)	`en-US-EmmaMultilingualNeural` (女性)
`fr-FR`	法文 (法國)	`fr-FR-RemyMultilingualNeural` (男性)
`en-US`	英文 (美國)	`en-US-BrianMultilingualNeural` (男性)
`en-US`	英文 (美國)	`en-US-AndrewMultilingualNeural` (男性)
`fr-FR`	法文 (法國)	`fr-FR-VivienneMultilingualNeural` (女性)
`zh-CN`	中文 (國語，簡體)	`zh-CN-XiaoxiaoMultilingualNeural` (女性)
`zh-CN`	中文 (國語，簡體)	`zh-CN-XiaochenMultilingualNeural` (女性)
`zh-CN`	中文 (國語，簡體)	`zh-CN-YunyiMultilingualNeural` (男性)

為公開預覽推出新的 zh-CN-XiaoxiaoDialectsNeural 語音，支援多種中文方言和口音：

語音名稱	次要語言	方言/口音
`zh-CN-XiaoxiaoDialectsNeural`	`zh-CN-shaanxi`	中文 (中原官話陝西，簡體)
	`zh-CN-sichuan`	中文 (西南官話，簡體)
	`zh-CN-shanxi`	中文 (山西口音普通話，簡體)
	`nan-CN`	中文 (閩南，簡體)
	`zh-CN-anhui`	中文 (安徽江淮普通話，簡體)
	`zh-CN-hunan`	中文 (湖南口音普通話，簡體)
	`zh-CN-gansu`	中文 (甘肅蘭陰普通話，簡體)
	`zh-CN-shandong`	中文 (冀魯官話，簡體)
	`zh-CN-henan`	中文 (中原官話河南，簡體)
	`zh-CN-liaoning`	中文 (東北官話，簡體)
	`zh-TW`	中文 (國語，繁體)

2023 年 11 月版本

個人版語音

個人版語音可在以下區域預覽使用：西歐、美國東部和東南亞。有了個人版語音 (預覽版)，您可以在幾秒鐘內取得 AI 對您 (或應用程式使用者) 的語音生成複寫。您提供一分鐘的語音樣本做為音訊提示，然後系統便可使用樣本來生成 100 多個地區設定支援的任何 90 多種語言的語音。

如需詳細資訊，請參閱個人版語音。

文字轉換語音虛擬人偶

文字轉換語音虛擬人偶可在下列區域中預覽使用：美國西部 2、西歐和東南亞。

文字轉換語音虛擬人偶會將文字轉換為自然發音且逼真的人類數位影片 (預先建置的虛擬人偶或自訂文字轉換語音虛擬人偶)。文字轉換語音虛擬人偶影片可以非同步或即時合成。開發人員可以透過 API 建立與文字轉換語音虛擬人偶整合的應用程式，或使用 Speech Studio 上的內容建立工具來建立影片內容，而無需進行編碼。

如需詳細資訊，請參閱文字轉換語音虛擬人偶、透明度資訊，以及公開語音和虛擬人偶配音員。

自訂神經語音

已新增 24 個新的地區設定支援，適用於跨語言語音。如需詳細資訊，請參閱完整語言清單。

預建神經語音

推出新的語音以進行公開預覽：

地區設定 (BCP-47)	語言	文字轉換語音的語音
`de-DE`	德文 (德國)	`SeraphinaNeural` (女性)
`es-ES`	西班牙文 (西班牙)	`XimenaNeural` (女性)
`fr-CA`	法文 (加拿大)	`ThierryNeural` (男性)
`fr-FR`	法文 (法國)	`VivienneNeural` (女性)
`it-IT`	義大利文 (義大利)	`GiuseppeNeural` (男性)
`ko-KR`	韓文 (韓國)	`HyunsuNeural` (男性)
`pt-BR`	葡萄牙文 (巴西)	`ThalitaNeural` (女性)

已修正錯誤 (bug) 和品質改進的模型：

地區設定 (BCP-47)	語言	文字轉換語音的語音
`es-ES`	西班牙文 (西班牙)	`AlvaroNeural` (男性)
`en-GB`	英文 (英國)	`RyanNeural` (男性)
`ko-KR`	韓文 (韓國)	`InjoonNeural` (男性)

如需詳細資訊，請參閱完整語言和語音清單。

2023 年 10 月發行版本

自訂神經語音

已新增自訂神經語音專業版的 12 個新地區設定支援。如需詳細資訊，請參閱完整語言清單。

2023 年 9 月發行版本

預建神經語音

推出新的語音以進行公開預覽：

地區設定 (BCP-47)	語言	文字轉換語音的語音
`en-US`	英文 (美國)	`en-US-EmmaNeural` (女性)
`en-US`	英文 (美國)	`en-US-AndrewNeural` (男性)
`en-US`	英文 (美國)	`en-US-BrianNeural` (男性)

如需詳細資訊，請參閱完整語言和語音清單。

內嵌神經語音

這裡所有的 147 個地區設定 (除了 fa-IR，波斯文 (伊朗) 以外) 都是立即可用，並具有 1 個選定的女性語音和/或 1 個選定的男性語音。

2023 年 8 月版本

自訂神經語音

最新的 CNV 精簡版定型配方版本現已發行。此版本會為您的語言模型品質帶來數個增強功能。試用 Speech Studio。

2023 年 7 月發行版本

自訂神經語音

多樣式語音已正式推出。
在公開預覽中已新增兩個新的地區設定，適用於多樣式語音：ja-JP 和 zh-CN。如需詳細資訊，請參閱完整語言和語音清單。請參閱不同語言的預設樣式清單。
跨語系語音已正式推出。
已新增兩個新的地區設定，適用於跨語言語音：id-ID 和 nl-NL。如需詳細資訊，請參閱完整語言和語音清單。

預建的類神經 TTS 語音

介紹公開預覽的新 en-US 性別中性語音：

地區設定 (BCP-47)	語言	文字轉換語音的語音
`en-US`	英文 (美國)	`en-US-BlueNeural` (中性)

推出新的多語系語音以進行公開預覽：

地區設定 (BCP-47)	語言	文字轉換語音的語音
`en-US`	英文 (美國)	`en-US-JennyMultilingualV2Neural` (女性)
`en-US`	英文 (美國)	`en-US-RyanMultilingualNeural` (男性)

多語系語音 en-US-JennyMultilingualV2Neural 和 en-US-RyanMultilingualNeural 自動偵測輸入文字的語言。不過，您仍然可以使用 <lang> 元素來調整這些語音的說話語言。

這些新的多語系語音可以使用 41 種語言和口音：Arabic (Egypt)、Arabic (Saudi Arabia)、Catalan、Czech (Czechia)、Danish (Denmark)、German (Austria)、German (Switzerland)、German (Germany)、English (Australia)、English (Canada)、English (United Kingdom)、English (Hong Kong SAR)、English (Ireland)、English (India)、English (United States)、Spanish (Spain)、Spanish (Mexico)、Finnish (Finland)、French (Belgium)、French (Canada)、French (Switzerland)、French (France)、Hindi (India)、Hungarian (Hungary)、Indonesian (Indonesia)、Italian (Italy)、Japanese (Japan)、Korean (Korea)、Norwegian Bokmål (Norway)、Dutch (Belgium)、Dutch (Netherlands)、Polish (Poland)、Portuguese (Brazil)、Portuguese (Portugal)、Russian (Russia)、Swedish (Sweden)、Thai (Thailand)、Turkish (Türkiye)、Chinese (Mandarin, Simplified)、Chinese (Cantonese, Traditional)、Chinese (Taiwanese Mandarin, Traditional)。

這些多語系語音完全不支援某些 SSML 元素，例如中斷、強調、無聲和子。

重要

語音 en-US-JennyMultilingualV2Neural 會暫時在公開預覽中提供，以供評估之用。未來將予以移除。

為了以英文以外的語言說話，目前的 en-US-JennyMultilingualNeural 語音實作需要您設定 <lang xml:lang> 元素。我們預期在 2023 年第 4 季，en-US-JennyMultilingualNeural 語音將會更新為以沒有 <lang xml:lang> 元素的輸入文字語言說話。這會與 en-US-JennyMultilingualV2Neural 語音同位。

在公開預覽版中介紹下列語音的新功能：

已新增塞爾維亞文 (塞爾維亞) sr-RS 語音的拉丁輸入：sr-latn-RS-SophieNeural 和 sr-latn-RS-NicholasNeural。
已新增阿爾巴尼亞文 (阿爾巴尼亞) sq-AL 語音的英文發音支援：sq-AL-AnilaNeural 和 sq-AL-IlirNeural。

2023 年 5 月版本

音訊內容建立

所有具有說話樣式和多樣式自訂語音的預先建置語音都支援樣式度調整。
現在，說出單字並錄製，即可修正單字的發音。音素可以從您的錄製自動辨識。 透過說話辨識功能現在處於公開預覽。

2023 年 4 月版本

預建的類神經 TTS 語音

這些語音的下列功能已從公開預覽移至 GA：

樣式	文字轉換語音的語音
style="chat"	`en-GB-RyanNeural`、`es-MX-JorgeNeural` 和 `it-IT-IsabellaNeural`
style="cheerful"	`en-GB-RyanNeural`、`en-GB-SoniaNeural`、`es-MX-JorgeNeural`、`fr-FR-DeniseNeural`、`fr-FR-HenriNeural` 和 `it-IT-IsabellaNeural`
style="sad"	`en-GB-SoniaNeural`、`fr-FR-DeniseNeural` 及 `fr-FR-HenriNeural`

改善 hi-IN 和 ta-IN 語音的 te-IN 英文發音，現在是在公開預覽區域中的發行小眾測試版

如需詳細資訊，請參閱語言和語音清單。

2023 年 3 月版本

新功能

語音合成標記語言 (SSML) 已更新，以支援音訊效果處理器元素，以針對裝置上的特定案例最佳化合成語音輸出的品質。深入了解語音合成標記。

自訂神經語音

已新增自訂神經語音專業版的 nl-BE 地區設定支援。如需詳細資訊，請參閱完整語言和語音清單。

預建的類神經 TTS 語音

下列語音現在已正式推出。如需詳細資訊，請參閱完整語言和語音清單。

地區設定 (BCP-47)	語言	文字轉換語音的語音
`en-AU`	英文 (澳大利亞)	`en-AU-AnnetteNeural` (女性) `en-AU-CarlyNeural` (女性) `en-AU-DarrenNeural` (男性) `en-AU-DuncanNeural` (男性) `en-AU-ElsieNeural` (女性) `en-AU-FreyaNeural` (女性) `en-AU-JoanneNeural` (女性) `en-AU-KenNeural` (男性) `en-AU-KimNeural` (女性) `en-AU-NeilNeural` (男性) `en-AU-TimNeural` (男性) `en-AU-TinaNeural` (女性) `en-AU-WilliamNeural` (男性)
`en-GB`	英文 (英國)	`en-GB-RyanNeural` (男性) `en-GB-SoniaNeural` (女性)
`es-ES`	西班牙文 (西班牙)	`es-ES-AbrilNeural` (女性) `es-ES-ArnauNeural` (男性) `es-ES-DarioNeural` (男性) `es-ES-EliasNeural` (男性) `es-ES-EstrellaNeural` (女性) `es-ES-IreneNeural` (女性) `es-ES-LaiaNeural` (女性) `es-ES-LiaNeural` (女性) `es-ES-NilNeural` (男性) `es-ES-SaulNeural` (男性) `es-ES-TeoNeural` (男性) `es-ES-TrianaNeural` (女性) `es-ES-VeraNeural` (女性)
`es-MX`	西班牙文 (墨西哥)	`es-MX-JorgeNeural` (男性)
`fr-FR`	法文 (法國)	`fr-FR-HenriNeural` (男性)
`it-IT`	義大利文 (義大利)	`it-IT-IsabellaNeural` (女性)
`ja-JP`	日文 (日本)	`ja-JP-AoiNeural` (女性) `ja-JP-DaichiNeural` (男性) `ja-JP-MayuNeural` (女性) `ja-JP-NaokiNeural` (男性) `ja-JP-ShioriNeural` (女性)

已新增使用 de-DE-ConradNeural 語音的 cheerful 樣式支援。

2023 年 2 月版本

預建的類神經 TTS 語音

下列語音現在已正式推出。如需詳細資訊，請參閱完整語言和語音清單。

地區設定 (BCP-47)	語言	文字轉換語音的語音
`zh-CN`	中文 (國語，簡體)	`zh-CN-XiaomengNeural` (女性) `zh-CN-XiaoyiNeural` (女性) `zh-CN-XiaozhenNeural` (女性) `zh-CN-YunfengNeural` (男性) `zh-CN-YunhaoNeural` (男性) `zh-CN-YunjianNeural` (男性) `zh-CN-YunxiaNeural` (男性) `zh-CN-YunzeNeural` (男性)
`zh-CN-henan`	中文 (中原官話河南，簡體)	`zh-CN-henan-YundengNeural` (男性)

2022 年 12 月版本

批次合成 REST API (預覽)

批次合成 API 目前為公開預覽狀態。正式推出之後，長音訊 API 會被取代。如需詳細資訊，請參閱移轉至批次合成 API。

2022 年 11 月版本

預建的神經 TTS 語音 (GA)

下列語音現在已正式推出。如需詳細資訊，請參閱完整語言和語音清單。

地區設定 (BCP-47)	語言	文字轉換語音的語音
`es-MX`	西班牙文 (墨西哥)	`es-MX-BeatrizNeural` (女性) `es-MX-CandelaNeural` (女性) `es-MX-CarlotaNeural` (女性) `es-MX-CecilioNeural` (男性) `es-MX-GerardoNeural` (男性) `es-MX-LarissaNeural` (女性) `es-MX-LibertoNeural` (男性) `es-MX-LucianoNeural` (男性) `es-MX-MarinaNeural` (女性) `es-MX-NuriaNeural` (女性) `es-MX-PelayoNeural` (男性) `es-MX-RenataNeural` (女性) `es-MX-YagoNeural` (男性)
`it-IT`	義大利文 (義大利)	`it-IT-BenignoNeural` (男性) `it-IT-CalimeroNeural` (男性) `it-IT-CataldoNeural` (男性) `it-IT-FabiolaNeural` (女性) `it-IT-FiammaNeural` (女性) `it-IT-GianniNeural` (男性) `it-IT-ImeldaNeural` (女性) `it-IT-IrmaNeural` (女性) `it-IT-LisandroNeural` (男性) `it-IT-PalmiraNeural` (女性) `it-IT-PierinaNeural` (女性) `it-IT-RinaldoNeural` (男性)
`pt-BR`	葡萄牙文 (巴西)	`pt-BR-BrendaNeural` (女性) `pt-BR-DonatoNeural` (男性) `pt-BR-ElzaNeural` (女性) `pt-BR-FabioNeural` (男性) `pt-BR-GiovannaNeural` (女性) `pt-BR-HumbertoNeural` (男性) `pt-BR-JulioNeural` (男性) `pt-BR-LeilaNeural` (女性) `pt-BR-LeticiaNeural` (女性) `pt-BR-ManuelaNeural` (女性) `pt-BR-NicolauNeural` (男性) `pt-BR-ValerioNeural` (男性) `pt-BR-YaraNeural` (女性)

自訂神經語音

自訂神經語音已新增下列地區設定支援。如需詳細資訊，請參閱完整語言和語音清單。

已新增自訂神經語音專業版的 fr-BE 地區設定支援。
已新增自訂神經語音精簡版的 es-ES 地區設定支援。

2022 年 10 月版本

預建的神經 TTS 語音 (GA)

下列語音現在已正式推出。如需詳細資訊，請參閱完整語言和語音清單。

地區設定 (BCP-47)	語言	文字轉換語音的語音
`eu-ES`	巴斯克文	`eu-ES-AinhoaNeural` (女性) `eu-ES-AnderNeural` (男性)
`hy-AM`	亞美尼亞文 (亞美尼亞)	`hy-AM-AnahitNeural` (女性) `hy-AM-HaykNeural` (男性)

預建的神經 TTS 語音 (預覽)

下列項目目前處於公開預覽狀態。如需詳細資訊，請參閱完整語言和語音清單。

地區設定 (BCP-47)	語言	文字轉換語音的語音
`en-AU`	英文 (澳大利亞)	`en-AU-AnnetteNeural`(女性) `en-AU-CarlyNeural`(女性) `en-AU-DarrenNeural`(男性) `en-AU-DuncanNeural`(男性) `en-AU-ElsieNeural`(女性) `en-AU-FreyaNeural`(女性) `en-AU-JoanneNeural`(女性) `en-AU-KenNeural`(男性) `en-AU-KimNeural`(女性) `en-AU-NeilNeural`(男性) `en-AU-TimNeural`(男性) `en-AU-TinaNeural`(女性)
`es-ES`	西班牙文 (西班牙)	`es-ES-AbrilNeural`(女性) `es-ES-AlvaroNeural`(男性) `es-ES-ArnauNeural`(男性) `es-ES-DarioNeural`(男性) `es-ES-EliasNeural`(男性) `es-ES-EstrellaNeural`(女性) `es-ES-IreneNeural`(女性) `es-ES-LaiaNeural`(女性) `es-ES-LiaNeural`(女性) `es-ES-NilNeural`(男性) `es-ES-SaulNeural`(男性) `es-ES-TeoNeural`(男性) `es-ES-TrianaNeural`(女性) `es-ES-VeraNeural`(女性)
`ja-JP`	日文 (日本)	`ja-JP-AoiNeural`(女性) `ja-JP-DaichiNeural`(男性) `ja-JP-MayuNeural`(女性) `ja-JP-NaokiNeural`(男性) `ja-JP-ShioriNeural`(女性)
`ko-KR`	韓文 (韓國)	`ko-KR-BongJinNeural`(男性) `ko-KR-GookMinNeural`(男性) `ko-KR-JiMinNeural`(女性) `ko-KR-SeoHyeonNeural`(女性) `ko-KR-SoonBokNeural`(女性) `ko-KR-YuJinNeural`(女性)
`wuu-CN`	中文 (吳語，簡體)	`wuu-CN-XiaotongNeural` (女性) `wuu-CN-YunzheNeural` (男性)
`yue-CN`	中文 (廣東話，簡體)	`yue-CN-XiaoMinNeural` (女性) `yue-CN-YunSongNeural` (男性)

一般 TTS 語音更新

改善 fil-PH-AngeloNeural 和 fil-PH-BlessicaNeural 語音的品質。
文字正規化規則會針對使用 es-CL 西班牙文 (智利) 和 uz-UZ 烏茲別克文 (烏茲別克斯坦) 地區設定的語音進行更新。
已新增語音使用 sq-AL 阿爾巴尼亞文 (阿爾巴尼亞) 和 az-AZ 亞塞拜然文 (亞塞拜然) 地區設定的英文字母拼字。
改善 zh-HK-WanLungNeural 語音的英文發音。
改善 nl-NL-MaartenNeural 和 pt-BR-AntonioNeural 語音的疑問語調。
已新增 <lang ="en-US"> 標籤的支援，以在使用下列語音時取得更佳的英文發音：de-DE-ConradNeural、de-DE-KatjaNeural、es-ES-AlvaroNeural、es-MX-DaliaNeural、es-MX-JorgeNeural、fr-CA-SylvieNeural、fr-FR-DeniseNeural、fr-FR-HenriNeural、it-IT-DiegoNeural 和 it-IT-IsabellaNeural。
已新增使用下列語音時的 style="chat" 標籤支援：en-GB-RyanNeural、es-MX-JorgeNeural 和 it-IT-IsabellaNeural。
已新增使用下列語音時的 style="cheerful" 標籤支援：en-GB-RyanNeural、en-GB-SoniaNeural、es-MX-JorgeNeural、fr-FR-DeniseNeural、fr-FR-HenriNeural 和 it-IT-IsabellaNeural。
已新增使用下列語音時的 style="sad" 標籤支援：en-GB-SoniaNeural、fr-FR-DeniseNeural 和 fr-FR-HenriNeural。

2022 年 9 月版本

預建的類神經 TTS 語音

所有預先建置的神經語音都已升級為具有 48kHz 取樣率的高精確度語音。

2022 年 8 月版本

預建的類神經 TTS 語音

在公開預覽中發行新的語音：

英文 (美國) 語音：en-US-AIGenerate1Neural 和 en-US-AIGenerate2Neural。
適用於中文區域語言的語音：zh-CN-henan-YundengNeural、zh-CN-shaanxi-XiaoniNeural 和 zh-CN-shandong-YunxiangNeural。

如需詳細資訊，請參閱語言和語音清單。

2022 年 7 月版本

預建的類神經 TTS 語音

已在公開預覽版中新增 5 個 zh-CN 中文語音 (繁體、簡體) 和 1 個 en-US 英文語音 (北美洲)。請參閱完整語言和語音清單。

語言	地區設定	性別	語音名稱	樣式支援
中文 (國語，簡體)	`zh-CN`	女性	`zh-CN-XiaomengNeural`^新增	一般，使用 SSML 提供多種語音樣式
中文 (國語，簡體)	`zh-CN`	女性	`zh-CN-XiaoyiNeural`^新增	一般，使用 SSML 提供多種語音樣式
中文 (國語，簡體)	`zh-CN`	女性	`zh-CN-XiaozhenNeural`^新增	一般，使用 SSML 提供多種語音樣式
中文 (國語，簡體)	`zh-CN`	男性	`zh-CN-YunxiaNeural`^新增	一般，使用 SSML 提供多種語音樣式
中文 (國語，簡體)	`zh-CN`	男性	`zh-CN-YunzeNeural`^新增	一般，使用 SSML 提供多種語音樣式
英文 (美國)	`en-US`	男性	`en-US-RogerNeural`^新增	一般

已支援新增神經語音的樣式和角色。

語音	樣式	風格程度	角色
zh-CN-XiaomengNeural ^公開預覽	`chat`	支援
zh-CN-XiaoyiNeural ^公開預覽	`affectionate`, `angry`, `cheerful`, `disgruntled`, `embarrassed`, `fearful`, `gentle`, `sad`, `serious`	支援
zh-CN-XiaozhenNeural ^公開預覽	`angry`、`cheerful`、`disgruntled`、`fearful`、`sad`、`serious`	支援
zh-CN-YunxiaNeural ^公開預覽	`angry`, `calm`, `cheerful`, `fearful`, `sad`	支援
zh-CN-YunxiaNeural ^公開預覽	`angry`, `calm`, `cheerful`, `depressed`, `disgruntled`, `documentary-narration`, `fearful`, `sad`, `serious`	支援	支援

使用 viseme 取得臉部位置

已新增對使用混合圖形來驅動您設計的 3D 人物臉部動作的支援。深入了解如何使用 Viseme 取得臉部位置。
已更新 SSML 以支援 Viseme 元素。請參閱語音合成標記。

2022 年 6 月版本

預建的類神經 TTS 語音

已新增適用於類神經文字轉換語音的 9 種新語言和變體：

語言	地區設定	性別	語音名稱	樣式支援
阿拉伯文 (黎巴嫩)	`ar-LB`	女性	`ar-LB-LaylaNeural`^新增	一般
阿拉伯文 (黎巴嫩)	`ar-LB`	男性	`ar-LB-RamiNeural`^新增	一般
阿拉伯文 (阿曼)	`ar-OM`	女性	`ar-OM-AyshaNeural`^新增	一般
阿拉伯文 (阿曼)	`ar-OM`	男性	`ar-OM-AbdullahNeural`^新增	一般
亞塞拜然文 (亞塞拜然)	`az-AZ`	女性	`az-AZ-BabekNeural`^新增	一般
亞塞拜然文 (亞塞拜然)	`az-AZ`	男性	`az-AZ-BanuNeural`^新增	一般
波士尼亞文 (波士尼亞赫塞哥維納)	`bs-BA`	女性	`bs-BA-VesnaNeural`^新增	一般
波士尼亞文 (波士尼亞赫塞哥維納)	`bs-BA`	男性	`bs-BA-GoranNeural`^新增	一般
喬治亞文 (喬治亞)	`ka-GE`	女性	`ka-GE-EkaNeural`^新增	一般
喬治亞文 (喬治亞)	`ka-GE`	男性	`ka-GE-GiorgiNeural`^新增	一般
蒙古文 (蒙古)	`mn-MN`	女性	`mn-MN-YesuiNeural`^新增	一般
蒙古文 (蒙古)	`mn-MN`	男性	`mn-MN-BataaNeural`^新增	一般
尼泊爾文 (尼泊爾)	`ne-NP`	女性	`ne-NP-HemkalaNeural`^新增	一般
尼泊爾文 (尼泊爾)	`ne-NP`	男性	`ne-NP-SagarNeural`^新增	一般
阿爾巴尼亞文 (阿爾巴尼亞)	`sq-AL`	女性	`sq-AL-AnilaNeural`^新增	一般
阿爾巴尼亞文 (阿爾巴尼亞)	`sq-AL`	男性	`sq-AL-IlirNeural`^新增	一般
坦米爾文 (馬來西亞)	`ta-MY`	女性	`ta-MY-KaniNeural`^新增	一般
坦米爾文 (馬來西亞)	`ta-MY`	男性	`ta-MY-SuryaNeural`^新增	一般

正式發行 36 種語音的公開預覽，適用於 en-GB 英文 (英國)、fr-FR 法文 (法國) 和 de-DE 德文 (德國)：

語言	地區設定	性別	語音名稱	樣式支援
英文 (英國)	`en-GB`	女性	`en-GB-AbbiNeural`	一般
英文 (英國)	`en-GB`	女性	`en-GB-BellaNeural`	一般
英文 (英國)	`en-GB`	女性	`en-GB-HollieNeural`	一般
英文 (英國)	`en-GB`	女性	`en-GB-MaisieNeural`	一般、兒童語音
英文 (英國)	`en-GB`	女性	`en-GB-OliviaNeural`	一般
英文 (英國)	`en-GB`	女性	`en-GB-SoniaNeural`	一般
英文 (英國)	`en-GB`	男性	`en-GB-AlfieNeural`	一般
英文 (英國)	`en-GB`	男性	`en-GB-ElliotNeural`	一般
英文 (英國)	`en-GB`	男性	`en-GB-EthanNeural`	一般
英文 (英國)	`en-GB`	男性	`en-GB-NoahNeural`	一般
英文 (英國)	`en-GB`	男性	`en-GB-OliverNeural`	一般
英文 (英國)	`en-GB`	男性	`en-GB-ThomasNeural`	一般
法文 (法國)	`fr-FR`	女性	`fr-FR-BrigitteNeural`	一般
法文 (法國)	`fr-FR`	女性	`fr-FR-CelesteNeural`	一般
法文 (法國)	`fr-FR`	女性	`fr-FR-CoralieNeural`	一般
法文 (法國)	`fr-FR`	女性	`fr-FR-EloiseNeural`	一般、兒童語音
法文 (法國)	`fr-FR`	女性	`fr-FR-JacquelineNeural`	一般
法文 (法國)	`fr-FR`	女性	`fr-FR-JosephineNeural`	一般
法文 (法國)	`fr-FR`	女性	`fr-FR-YvetteNeural`	一般
法文 (法國)	`fr-FR`	男性	`fr-FR-AlainNeural`	一般
法文 (法國)	`fr-FR`	男性	`fr-FR-ClaudeNeural`	一般
法文 (法國)	`fr-FR`	男性	`fr-FR-JeromeNeural`	一般
法文 (法國)	`fr-FR`	男性	`fr-FR-MauriceNeural`	一般
法文 (法國)	`fr-FR`	男性	`fr-FR-YvesNeural`	一般
德文 (德國)	`de-DE`	女性	`de-DE-AmalaNeural`	一般
德文 (德國)	`de-DE`	女性	`de-DE-ElkeNeural`	一般
德文 (德國)	`de-DE`	女性	`de-DE-GiselaNeural`	一般、兒童語音
德文 (德國)	`de-DE`	女性	`de-DE-KlarissaNeural`	一般
德文 (德國)	`de-DE`	女性	`de-DE-LouisaNeural`	一般
德文 (德國)	`de-DE`	女性	`de-DE-MajaNeural`	一般
德文 (德國)	`de-DE`	女性	`de-DE-TanjaNeural`	一般
德文 (德國)	`de-DE`	男性	`de-DE-BerndNeural`	一般
德文 (德國)	`de-DE`	男性	`de-DE-ChristophNeural`	一般
德文 (德國)	`de-DE`	男性	`de-DE-KasperNeural`	一般
德文 (德國)	`de-DE`	男性	`de-DE-KillianNeural`	一般
德文 (德國)	`de-DE`	男性	`de-DE-KlausNeural`	一般
德文 (德國)	`de-DE`	男性	`de-DE-RalfNeural`	一般

在公開預覽中為 es-MX 西班牙文 (墨西哥)、it-IT 義大利文 (義大利)、pt-BR 葡萄牙文 (巴西) 新增 40 種新語音，以及為 zh-CN 中文 (普通話，簡體) 新增 2 種口音：

語言	地區設定	性別	語音名稱	樣式支援
西班牙文 (墨西哥)	`es-MX`	女性	`es-MX-BeatrizNeural`^新增	一般
西班牙文 (墨西哥)	`es-MX`	女性	`es-MX-CarlotaNeural`^新增	一般
西班牙文 (墨西哥)	`es-MX`	女性	`es-MX-NuriaNeural`^新增	一般
西班牙文 (墨西哥)	`es-MX`	女性	`es-MX-RenataNeural`^新增	一般
西班牙文 (墨西哥)	`es-MX`	女性	`es-MX-LarissaNeural`^新增	一般
西班牙文 (墨西哥)	`es-MX`	女性	`es-MX-CandelaNeural`^新增	一般
西班牙文 (墨西哥)	`es-MX`	女性	`es-MX-MarinaNeural`^新增	一般
義大利文 (義大利)	`it-IT`	女性	`it-IT-FiammaNeural`^新增	一般
義大利文 (義大利)	`it-IT`	女性	`it-IT-IrmaNeural`^新增	一般
義大利文 (義大利)	`it-IT`	女性	`it-IT-FabiolaNeural`^新增	一般
義大利文 (義大利)	`it-IT`	女性	`it-IT-PalmiraNeural`^新增	一般
義大利文 (義大利)	`it-IT`	女性	`it-IT-ImeldaNeural`^新增	一般
義大利文 (義大利)	`it-IT`	女性	`it-IT-PierinaNeural`^新增	一般
葡萄牙文 (巴西)	`pt-BR`	女性	`pt-BR-ElzaNeural`^新增	一般
葡萄牙文 (巴西)	`pt-BR`	女性	`pt-BR-ManuelaNeural`^新增	一般
葡萄牙文 (巴西)	`pt-BR`	女性	`pt-BR-BrendaNeural`^新增	一般
葡萄牙文 (巴西)	`pt-BR`	女性	`pt-BR-LeilaNeural`^新增	一般
葡萄牙文 (巴西)	`pt-BR`	女性	`pt-BR-YaraNeural`^新增	一般
葡萄牙文 (巴西)	`pt-BR`	女性	`pt-BR-GiovannaNeural`^新增	一般
葡萄牙文 (巴西)	`pt-BR`	女性	`pt-BR-LeticiaNeural`^新增	一般
西班牙文 (墨西哥)	`es-MX`	男性	`es-MX-CecilioNeural`^新增	一般
西班牙文 (墨西哥)	`es-MX`	男性	`es-MX-LibertoNeural`^新增	一般
西班牙文 (墨西哥)	`es-MX`	男性	`es-MX-LucianoNeural`^新增	一般
西班牙文 (墨西哥)	`es-MX`	男性	`es-MX-PelayoNeural`^新增	一般
西班牙文 (墨西哥)	`es-MX`	男性	`es-MX-YagoNeural`^新增	一般
西班牙文 (墨西哥)	`es-MX`	男性	`es-MX-GerardoNeural`^新增	一般
義大利文 (義大利)	`it-IT`	男性	`it-IT-BenignoNeural`^新增	一般
義大利文 (義大利)	`it-IT`	男性	`it-IT-CataldoNeural`^新增	一般
義大利文 (義大利)	`it-IT`	男性	`it-IT-LisandroNeural`^新增	一般
義大利文 (義大利)	`it-IT`	男性	`it-IT-CalimeroNeural`^新增	一般
義大利文 (義大利)	`it-IT`	男性	`it-IT-RinaldoNeural`^新增	一般
義大利文 (義大利)	`it-IT`	男性	`it-IT-GianniNeural`^新增	一般
葡萄牙文 (巴西)	`pt-BR`	男性	`pt-BR-DonatoNeural`^新增	一般
葡萄牙文 (巴西)	`pt-BR`	男性	`pt-BR-HumbertoNeural`^新增	一般
葡萄牙文 (巴西)	`pt-BR`	男性	`pt-BR-FabioNeural`^新增	一般
葡萄牙文 (巴西)	`pt-BR`	男性	`pt-BR-JulioNeural`^新增	一般
葡萄牙文 (巴西)	`pt-BR`	男性	`pt-BR-ValerioNeural`^新增	一般
葡萄牙文 (巴西)	`pt-BR`	男性	`pt-BR-NicolauNeural`^新增	一般
中文 (國語，簡體)	`zh-CN-sichuan`	男性	`zh-CN-sichuan-YunxiSichuanNeural`^新增	一般、四川腔調
中文 (國語，簡體)	`zh-CN-liaoning`	女性	`zh-CN-liaoning-XiaobeiNeural`^新增	一般，遼寧腔調

改善 en-SG-LunaNeural 和 en-SG-WayneNeural 的品質
公開預覽現可支援 48Khz 輸出，適用於 en-US-AriaNeural、en-US-JennyNeural 和 zh-CN-XiaoxiaoNeural

自訂神經語音

啟用以線上修正資料問題。深入了解如何在 Speech Studio 中解決資料問題。
已新增訓練配方版本。深入了解如何為您的語音模型選取訓練配方版本。

音訊內容建立工具

支援分頁。
啟用以依工作檔案頁面上的名稱、檔案類型和更新時間進行全域排序。

2022 年 5 月版本

預建的類神經 TTS 語音

在公開預覽中發行 5 種新語音，其中包含多種風格以擴充美式英文的各種變化。請參閱完整語言和語音清單。
en-US-AriaNeural 的公開預覽支援這些新風格 Angry、Excited、Friendly、Hopeful、Sad、Shouting、Unfriendly、Terrified 和 Whispering。
en-US-GuyNeural、en-US-JennyNeural 的公開預覽支援這些新風格 Angry、Cheerful、Excited、Friendly、Hopeful、Sad、Shouting、Unfriendly、Terrified 和 Whispering。
en-US-SaraNeural 的公開預覽支援這些新風格 Excited、Friendly、Hopeful、Shouting、Unfriendly、Terrified 和 Whispering。請參閱語音風格和角色。
在公開預覽中發行新的語音 zh-CN-YunjianNeural、zh-CN-YunhaoNeural 和 zh-CN-YunfengNeural。請參閱完整語言和語音清單。
zh-CN-YunjianNeural 的公開預覽支援 2 種新風格 sports-commentary、sports-commentary-excited。請參閱語音風格和角色。
zh-CN-YunhaoNeural 的公開預覽支援 1 種新風格 advertisement-upbeat。請參閱語音風格和角色。
在所有區域正式發行適用於 fr-FR-DeniseNeural 的 cheerful 和 sad 風格。
已更新 SSML 以支援 en-US 和 en-AU 語音的 MathML 元素。深入了解語音合成標記。

自訂神經語音

啟用以取消訓練語音模型期間的訓練。深入了解如何取消訓練。
啟用以複製模型 (重新命名語音模型)。深入了解如何重新命名語音模型。
啟用以透過新增您自己的測試指令碼來測試語音模型。深入了解如何上傳測試指令碼。
啟用以更新語音模型的引擎版本。深入了解如何更新模型引擎版本。
支援更多訓練區域。請參閱區域支援。
支援適用於自訂神經語音精簡版 (預覽) 的 10 個地區設定。請參閱語言支援。

音訊內容建立工具

啟用以試用音訊內容建立工具，無需登入。
改善調整音素的版面配置。
增強效能：指定一次上傳的檔案數量上限 (200)。
增強效能：指定目錄深度層級上限 (5 個層級)。

2022 年 3 月版本

預建的類神經 TTS 語音

已新增對 fr-FR-DeniseNeural 中 Cheerful 和 Sad 風格的支援。請參閱語音風格和角色。
發行中斷連線的容器，適用於公開預覽中預建的類神經 TTS 語音。請參閱在中斷連線的環境中使用 Docker 容器。

自訂神經語音

支援角色型存取控制。深入了解 Speech Studio 中的 Azure 角色型存取控制
支援私人端點與虛擬網路服務端點。深入了解如何搭配語音服務使用私人端點。

音訊內容建立工具

更新免費層 (F0) 資源的檔案大小和並行限制，讓體驗與語音 SDK 和 API 保持一致。請參閱語音服務配額和限制。

2022 年 2 月版本

自訂神經語音

已發行自訂神經語音精簡版 (公開預覽版)。深入瞭解什麼是自訂神經語音精簡版。
延伸語言支援至 49 個地區設定。請參閱語言支援。
支援更多區域/資料中心。請參閱區域支援。

音訊內容建立工具

已移除下載音訊的輸出長度限制。

2022 年 1 月版本

新語言和語音

已新增適用於類神經文字轉換語音的 10 種新語言和變體：

語言	地區設定	性別	語音名稱	樣式支援
孟加拉文 (印度)	`bn-IN`	女性	`bn-IN-TanishaaNeural`^新增	一般
孟加拉文 (印度)	`bn-IN`	男性	`bn-IN-BashkarNeural`^新增	一般
冰島文 (冰島)	`is-IS`	女性	`is-IS-GudrunNeural`^新增	一般
冰島文 (冰島)	`is-IS`	男性	`is-IS-GunnarNeural`^新增	一般
坎那達文 (印度)	`kn-IN`	女性	`kn-IN-SapnaNeural`^新增	一般
坎那達文 (印度)	`kn-IN`	男性	`kn-IN-GaganNeural`^新增	一般
哈薩克文 (哈薩克)	`kk-KZ`	女性	`kk-KZ-AigulNeural`^新增	一般
哈薩克文 (哈薩克)	`kk-KZ`	男性	`kk-KZ-DauletNeural`^新增	一般
寮文 (寮國)	`lo-LA`	女性	`lo-LA-KeomanyNeural`^新增	一般
寮文 (寮國)	`lo-LA`	男性	`lo-LA-ChanthavongNeural`^新增	一般
馬其頓文 (北馬其頓共和國)	`mk-MK`	女性	`mk-MK-MarijaNeural`^新增	一般
馬其頓文 (北馬其頓共和國)	`mk-MK`	男性	`mk-MK-AleksandarNeural`^新增	一般
馬來亞拉姆文 (印度)	`ml-IN`	女性	`ml-IN-SobhanaNeural`^新增	一般
馬來亞拉姆文 (印度)	`ml-IN`	男性	`ml-IN-MidhunNeural`^新增	一般
普什圖文 (阿富汗)	`ps-AF`	女性	`ps-AF-LatifaNeural`^新增	一般
普什圖文 (阿富汗)	`ps-AF`	男性	`ps-AF-GulNawazNeural`^新增	一般
塞爾維亞文 (塞爾維亞，斯拉夫)	`sr-RS`	女性	`sr-RS-SophieNeural`^新增	一般
塞爾維亞文 (塞爾維亞，斯拉夫)	`sr-RS`	男性	`sr-RS-NicholasNeural`^新增	一般
僧伽羅文 (斯里蘭卡)	`si-LK`	女性	`si-LK-ThiliniNeural`^新增	一般
僧伽羅文 (斯里蘭卡)	`si-LK`	男性	`si-LK-SameeraNeural`^新增	一般

如需可用語音的完整清單，請參閱語言支援。

預覽版中的新語音

已在預覽版中新增 en-GB、fr-FR 和 de-DE 的新語音：

語言	地區設定	性別	語音名稱	樣式支援
英文 (英國)	`en-GB`	女性	`en-GB-AbbiNeural`^新增	一般
英文 (英國)	`en-GB`	女性	`en-GB-BellaNeural`^新增	一般
英文 (英國)	`en-GB`	女性	`en-GB-HollieNeural`^新增	一般
英文 (英國)	`en-GB`	女性	`en-GB-OliviaNeural`^新增	一般
英文 (英國)	`en-GB`	女孩	`en-GB-MaisieNeural`^新增	一般
英文 (英國)	`en-GB`	男性	`en-GB-AlfieNeural`^新增	一般
英文 (英國)	`en-GB`	男性	`en-GB-ElliotNeural`^新增	一般
英文 (英國)	`en-GB`	男性	`en-GB-EthanNeural`^新增	一般
英文 (英國)	`en-GB`	男性	`en-GB-NoahNeural`^新增	一般
英文 (英國)	`en-GB`	男性	`en-GB-OliverNeural`^新增	一般
英文 (英國)	`en-GB`	男性	`en-GB-ThomasNeural`^新增	一般
法文 (法國)	`fr-FR`	女性	`fr-FR-BrigitteNeural`^新增	一般
法文 (法國)	`fr-FR`	女性	`fr-FR-CelesteNeural`^新增	一般
法文 (法國)	`fr-FR`	女性	`fr-FR-CoralieNeural`^新增	一般
法文 (法國)	`fr-FR`	女性	`fr-FR-JacquelineNeural`^新增	一般
法文 (法國)	`fr-FR`	女性	`fr-FR-JosephineNeural`^新增	一般
法文 (法國)	`fr-FR`	女性	`fr-FR-YvetteNeural`^新增	一般
法文 (法國)	`fr-FR`	女孩	`fr-FR-EloiseNeural`^新增	一般
法文 (法國)	`fr-FR`	男性	`fr-FR-AlainNeural`^新增	一般
法文 (法國)	`fr-FR`	男性	`fr-FR-ClaudeNeural`^新增	一般
法文 (法國)	`fr-FR`	男性	`fr-FR-JeromeNeural`^新增	一般
法文 (法國)	`fr-FR`	男性	`fr-FR-MauriceNeural`^新增	一般
法文 (法國)	`fr-FR`	男性	`fr-FR-YvesNeural`^新增	一般
德文 (德國)	`de-DE`	女性	`de-DE-AmalaNeural`^新增	一般
德文 (德國)	`de-DE`	女性	`de-DE-ElkeNeural`^新增	一般
德文 (德國)	`de-DE`	女性	`de-DE-KlarissaNeural`^新增	一般
德文 (德國)	`de-DE`	女性	`de-DE-LouisaNeural`^新增	一般
德文 (德國)	`de-DE`	女性	`de-DE-MajaNeural`^新增	一般
德文 (德國)	`de-DE`	女性	`de-DE-TanjaNeural`^新增	一般
德文 (德國)	`de-DE`	女孩	`de-DE-GiselaNeural`^新增	一般
德文 (德國)	`de-DE`	男性	`de-DE-BerndNeural`^新增	一般
德文 (德國)	`de-DE`	男性	`de-DE-ChristophNeural`^新增	一般
德文 (德國)	`de-DE`	男性	`de-DE-KasperNeural`^新增	一般
德文 (德國)	`de-DE`	男性	`de-DE-KillianNeural`^新增	一般
德文 (德國)	`de-DE`	男性	`de-DE-KlausNeural`^新增	一般
德文 (德國)	`de-DE`	男性	`de-DE-RalfNeural`^新增	一般

如需可用語音的完整清單，請參閱語言支援。

發音正確性

改善所有 he-IL 語音的英文字發音。
改善 cs-CZ 和 da-DK 的文字層級發音正確性。
改善阿拉伯文變音符號和希伯來文 Nikud (元音標註) 處理。
改善 ja-JP 的實體朗讀

Speech Studio

自訂神經語音：使用批次 API (長音訊 API) 啟用其他模型測試
音訊內容建立：啟用更多輸出格式

2021 年 10 月版本

新語言和語音

已新增適用於類神經文字轉換語音的 49 種新語言和 98 種語音：

af-ZA南非荷蘭文 (南非) 的 Adri、af-ZA南非荷蘭文 (南非) 的 Willem、am-ET阿姆哈拉文 (衣索比亞) 的 Mekdes、am-ET阿姆哈拉文 (衣索比亞) 的 Ameha、ar-AE阿拉伯文 (阿拉伯聯合大公國) 的 Fatima、ar-AE阿拉伯文 (阿拉伯聯合大公國) 的 Hamdan、ar-BH阿拉伯文 (巴林) 的 Laila、ar-BH阿拉伯文 (巴林) 的 Ali、ar-DZ阿拉伯文 (阿爾及利亞) 的 Amina、ar-DZ阿拉伯文 (阿爾及利亞) 的 Ismael、ar-IQ阿拉伯文 (伊拉克) 的 Rana、ar-IQ阿拉伯文 (伊拉克) 的 Bassel、ar-JO阿拉伯文 (約旦) 的 Sana、ar-JO阿拉伯文 (約旦) 的 Taim、ar-KW阿拉伯文 (科威特) 的 Noura、ar-KW阿拉伯文 (科威特) 的 Fahed、ar-LY阿拉伯文 (利比亞) 的 Iman、ar-LY阿拉伯文 (利比亞) 的 Omar、ar-MA阿拉伯文 (摩洛哥) 的 Mouna、ar-MA阿拉伯文 (摩洛哥) 的 Jamal、ar-QA阿拉伯文 (卡達) 的 Amal、ar-QA阿拉伯文 (卡達) 的 Moaz、ar-SY阿拉伯文 (敘利亞) 的 Amany、ar-SY阿拉伯文 (敘利亞) 的 Laith、ar-TN阿拉伯文 (突尼西亞) 的 Reem、ar-TN阿拉伯文 (突尼西亞) 的 Hedi、ar-YE阿拉伯文 (葉門) 的 Maryam、ar-YE阿拉伯文 (葉門) 的 Saleh、bn-BD孟加拉文 (孟加拉) 的 Nabanita、bn-BD孟加拉文 (孟加拉) 的 Pradeep、en-KE英文 (肯亞) 的 Asilia、en-KE英文 (肯亞) 的 Chilemba、en-NG英文 (奈及利亞) 的 Ezinne、en-NG英文 (奈及利亞) 的 Abeo、en-TZ英文 (坦尚尼亞) 的 Imani、en-TZ英文 (坦尚尼亞) 的 Elimu、es-BO西班牙文 (玻利維亞) 的 Sofia、es-BO西班牙文 (玻利維亞) 的 Marcelo、es-CL西班牙文 (智利) 的 Catalina、es-CL西班牙文 (智利) 的 Lorenzo、es-CR西班牙文 (哥斯大黎加) 的 Maria、es-CR西班牙文 (哥斯大黎加) 的 Juan、es-CU西班牙文 (古巴) 的 Belkys、es-CU西班牙文 (古巴) 的 Manuel、es-DO西班牙文 (多明尼加共和國) 的 Ramona、es-DO西班牙文 (多明尼加共和國) 的 Emilio、es-EC西班牙文 (厄瓜多) 的 Andrea、es-EC西班牙文 (厄瓜多) 的 Luis、es-GQ西班牙文 (赤道幾內亞) 的 Teresa、es-GQ西班牙文 (赤道幾內亞) 的 Javier、es-GT西班牙文 (瓜地馬拉) 的 Marta、es-GT西班牙文 (瓜地馬拉) 的 Andres、es-HN西班牙文 (宏都拉斯) 的 Karla、es-HN西班牙文 (宏都拉斯) 的 Carlos、es-NI西班牙文 (尼加拉瓜) 的 Yolanda、es-NI西班牙文 (尼加拉瓜) 的 Federico、es-PA西班牙文 (巴拿馬) 的 Nargarita、es-PA西班牙文 (巴拿馬) 的 Roberto、es-PE西班牙文 (秘魯) 的 Camila、es-PE西班牙文 (秘魯) 的 Alex、es-PR西班牙文 (波多黎各) 的 Karina、es-PR西班牙文 (波多黎各) 的 Victor、es-PY西班牙文 (巴拉圭) 的 Tania、es-PY西班牙文 (巴拉圭) 的 Mario、es-SV西班牙文 (薩爾瓦多) 的 Lorena、es-SV西班牙文 (薩爾瓦多) 的 Rodrigo、es-UY西班牙文 (烏拉圭) 的 Valentina、es-UY西班牙文 (烏拉圭) 的 Mateo、es-VE西班牙文 (委內瑞拉) 的 Paola、es-VE西班牙文 (委內瑞拉) 的 Sebastian、fa-IR波斯文 (伊朗) 的 Dilara、fa-IR波斯文 (伊朗) 的 Farid、fil-PH菲律賓文 (菲律賓) 的 Blessica、fil-PH菲律賓文 (菲律賓) 的 Angelo、gl-ES加利西亞文 (西班牙) 的 Sabela、gl-ES加利西亞文 (西班牙) 的 Roi、jv-ID爪哇文 (印尼) 的 Siti、jv-ID爪哇文 (印尼) 的 Dimas、km-KH高棉文 (柬埔寨) 的 Sreymom、km-KH高棉文 (柬埔寨) 的 Piseth、my-MM緬甸文 (緬甸) 的 Nilar、my-MM緬甸文 (緬甸) 的 Thiha、so-SO索馬利文 (索馬利亞) 的 Ubax、so-SO索馬利文 (索馬利亞) 的 Muuse、su-ID巽他文 (印尼) 的 Tuti、su-ID巽他文 (印尼) 的 Jajang、sw-TZ史瓦西里文 (坦尚尼亞) 的 Rehema、sw-TZ史瓦西里文 (坦尚尼亞) 的 Daudi、ta-LK坦米爾文 (斯里蘭卡) 的 Saranya、ta-LK坦米爾文 (斯里蘭卡) 的 Kumar、ta-SG坦米爾文 (新加坡) 的 Venba、ta-SG坦米爾文 (新加坡) 的 Anbu、ur-IN烏都文 (印度) 的 Gul、ur-IN烏都文 (印度) 的 Salman、uz-UZ烏茲別克文 (烏茲別克) 的 Madina、uz-UZ烏茲別克文 (烏茲別克) 的 Sardor、zu-ZA祖魯文 (南非) 的 Thando 和zu-ZA祖魯文 (南非) 的 Themba。

2021 年 9 月版本

新的en-US英文 (美國) 聊天機器人語音：Sara 代表一位年輕成人女性，可以更隨性地聊天，是最適合聊天機器人的案例。
新增新風格的ja-JP日文語音 Nanami：Nanami 提供三種新風格：聊天、自訂服務和歡快。
整體發音改善：id-ID的 Ardi、th-TH的 Premwadee、da-DK的 Christel、vi-VN的 HoaiMy 和 NamMinh。
2 種中文 zh-CN(普通話，中國) 新語音預覽：Xiaochen 與 Xiaoyan，針對自發性對話和自訂服務案例最佳化。

2021 年 7 月版本

類神經文字轉換語音更新

希伯來文中的發音錯誤減少 20%。

Speech Studio 更新

自訂神經語音：將定型管線更新為 UniTTSv3，以改善模型品質，而將原音模型的定型時間縮減為 50%。
音訊內容建立：已修正「匯出」效能問題和自訂神經語音選取的錯誤。

2021 年 6 月版本

Speech Studio 更新

自訂神經語音：自訂神經語音定型已擴充支援東南亞。為支援資料上傳狀態檢查所發行的新功能。
音訊內容建立：發行了支援自訂詞彙的新功能。使用這項功能，使用者可以輕鬆地建立其語彙檔案，並定義其音訊輸出的自訂發音。

2021 年 5 月版本

神經 TTS 新增的語言和語音

引進 10 種新語言 - 神經 TTS 語言清單於 10 個新地區設定中新增 20 種新語音：en-HK英文 (香港) 的 Yan、en-HK英文 (香港) 的 Sam、en-NZ英文 (紐西蘭) 的 Molly、en-NZ英文 (紐西蘭) 的 Mitchell、en-SG英文 (新加坡) 的 Luna、en-SG英文 (新加坡) 的 Wayne、en-ZA英文 (南非) 的 Leah、en-ZA英文 (南非) 的 Luke、gu-IN古吉拉特文 (印度) 的 Dhwani、gu-IN古吉拉特文 (印度) 的 Niranjan、mr-IN馬拉地文 (印度) 的 Aarohi、mr-IN馬拉地文 (印度) 的 Manohar、es-AR西班牙文 (阿根廷) 的 Elena、es-AR西班牙文 (阿根廷) 的 Tomas、es-CO西班牙文 (哥倫比亞) 的 Salome、es-CO西班牙文 (哥倫比亞) 的 Gonzalo、es-US西班牙文 (美國) 的 Paloma、es-US西班牙文 (美國) 的 Alonso、sw-KE斯瓦希里文 (肯亞) 的 Zuri 和sw-KE斯瓦希里文 (肯亞) 的 Rafiki。
11 種新 en-US 語音 (預覽版) - 美國英文新增 11 種 en-US 語音，包括 Ashley、Amber、Ana、Brandon、Christopher、Cora、Elizabeth、Eric、Michelle、Monica 和 Jacob。
5zh-CN 種中文 (普通話，簡體) 語音可使用 - 5 種中文 (普通話，簡體) 語音會從預覽版變更至正式推出。它們為 Yunxi、Xiaomo、Xiaoman、Xiaoxuan 和 Xiaorui。現在，這些語音都可以在所有區域中使用。 Yunxi 已新增新的助理風格，適合聊天機器人和語音代理程式。 Xiaomo 的語音風格經過調整，更自然且更有特色。

2021 年 4 月版本

類神經文字轉換語音現已在 21 個區域提供

已新增 12 個新區域 - 類神經文字轉換語音現已在下列 12 個新區域提供：Japan East、Japan West、Korea Central、North Central US、North Europe、South Central US、Southeast Asia、UK South、west Central US、West Europe、West US 和 West US 2。請參閱這裡，查看完整的 21 個支援區域清單。

2021 年 3 月版本

神經 TTS 新增的語言和語音

引進 6 種新語言 - 神經 TTS 語言清單於 6 個新地區設定中新增 12 種新語音：cy-GB威爾斯文 (英國) 的 Nia、cy-GB威爾斯文 (英國) 的 Aled、en-PH英文 (菲律賓) 的 Rosa、en-PH英文 (菲律賓) 的 James、fr-BE法文 (比利時) 的 Charline、fr-BE法文 (比利時) 的 Gerard、nl-BE荷蘭文 (比利時) 的 Dena、nl-BE荷蘭文 (比利時) 的 Arnaud、uk-UA烏克蘭文 (烏克蘭) 的 Polina、uk-UA烏克蘭文 (烏克蘭) 的 Ostap、ur-PK烏爾都文 (巴基斯坦) 的 Uzma 和 ur-PK烏爾都文 (巴基斯坦) 的 Asad。
從預覽版至正式發行的 5 種語言 - 11 月於 5 個地區設定中引進 10 種語音：et-EE愛沙尼亞文 (愛沙尼亞) 的 Kert、ga-IE愛爾蘭文 (愛爾蘭) 的 Colm、lv-LV拉脫維亞文 (拉脫維亞) 的 Nils、lt-LT立陶宛文 (立陶宛) 的 Leonas 和mt-MT馬爾他文 (馬爾他) 的 Joseph。
法文 (加拿大) 新增男性語音 - 新的語音 Antoine 適用於 fr-CA 法文 (加拿大)。
品質改善 - 發音錯誤率降低：hu-HU匈牙利文 - 48.17%、nb-NO挪威文 - 52.76%、nl-NL荷蘭文 (尼德蘭) - 22.11％%。

在此版本中，我們目前支援涵蓋 60 個語言 / 地區設定的 142 種神經語音。此外，49 個語言 / 地區設定中提供超過 70 種標準語音。請造訪語言支援查看完整清單。

使得臉部表情事件成為動畫字元

神經文字轉換語音目前包括描聲影像事件。發音嘴型事件可讓使用者取得一系列伴隨合成語音的臉部表情。發音嘴型可以用來控制 2D 和 3D 虛擬替身模型的動作，使其嘴部動作完全符合合成語音的內容。發音嘴型事件僅適用於此次 en-US-AriaNeural 語音。

新增書籤元素至語音合成標記語言 (SSML)

書簽元素可讓您在 SSML 中插入自訂標記，以取得音訊串流中每個標記的位移。可以用來參考文字或標記順序中的特定位置。

2021 年 2 月版本

自訂神經語音正式發行

自訂神經語音於 2 月正式發行 13 種語言：中文 (中文、簡體)、英文 (澳大利亞)、英文 (印度)、英文 (英國)、英文 (北美洲)、法文 (加拿大)、法文 (法國)、德文 (德國)、義大利文 (義大利)、日文 (日本)、韓文 (韓國)、葡萄牙文 (巴西)、西班牙文 (墨西哥) 和西班牙文 (西班牙)。深入瞭解什麼是自訂神經語音和如何負責任地使用它。自訂的神經語音功能需要註冊，而且 Microsoft 可能會根據 Microsoft 的資格準則限制存取。深入了解有限存取權。

2020 年 12 月版本

新神經語音的正式發行和預覽版

已在涵蓋 54 個語言 / 地區設定的 129 種神經語音中發行 51 種新的語音：

正式發行地區設定中的 46 種新語音：ar-EG阿拉伯文 (埃及) 的 Shakir、ar-SA阿拉伯文 (沙烏地阿拉伯) 的 Hamed、bg-BG保加利亞文 (保加利亞) 的 Borislav、ca-ES加泰蘭文的 Joana、cs-CZ捷克文 (捷克共和國) 的 Antonin、da-DK丹麥文 (丹麥) 的 Jeppe、de-AT德文 (奧地利) 的 Jonas、de-CH德文 (瑞士) 的 Jan、el-GR希臘文 (希臘) 的 Nestoras、en-CA英文 (加拿大) 的 Liam、en-IE英文 (愛爾蘭) 的 Connor、en-IN印地文 (印度) 的 Madhur、en-IN泰盧固文 (印度) 的 Mohan、en-IN英文 (印度) 的 Prabhat、en-IN泰米爾文 (印度) 的 Valluvar、es-ES加泰蘭文的 Enric、et-EE愛沙尼亞文 (愛沙尼亞) 的 Kert、fi-FI芬蘭文 (芬蘭) 的 Harri、fi-FI芬蘭文 (芬蘭) 的 Selma、fr-CH法文 (瑞士) 的 Fabrice、ga-IE愛爾蘭文 (愛爾蘭) 的 Colm、he-IL希伯來文 (以色列) 的 Avri、hr-HR克羅埃西亞文 (克羅埃西亞) 的 Srecko、hu-HU匈牙利文 (匈牙利) 的 Tamas、id-ID印尼文 (印尼) 的 Gadis、lt-LT立陶宛文 (立陶宛) 的 Leonas、lv-LV拉脫維亞文 (拉脫維亞) 的 Nils、ms-MY馬來文 (馬來西亞) 的 Osman、mt-MT馬爾他文 (馬爾他) 的 Joseph、nb-NO挪威文，書面挪威文 (挪威) 的 Finn、nb-NO挪威文，書面挪威文 (挪威) 的 Pernille、nl-NL荷蘭文 (尼德蘭) 的 Fenna、nl-NL荷蘭文 (尼德蘭) 的 Maarten、pl-PL波蘭文 (波蘭) 的 Agnieszka、pl-PL波蘭文 (波蘭) 的 Marek、pt-BR葡萄牙文 (巴西) 的 Duarte、pt-PT葡萄牙文 (葡萄牙) 的 Raquel、ro-RO羅馬尼亞文 (羅馬尼亞) 的 Emil、ru-RU俄文 (俄羅斯) 的 Dmitry、ru-RU俄文 (俄羅斯) 的 Svetlana、sk-SK斯洛伐克文 (斯洛伐克) 的 Lukas、sl-SI斯洛維尼亞文 (斯洛維尼亞) 的 Rok、sv-SE瑞典文 (瑞典) 的 Mattias、sv-SE瑞典文 (瑞典) 的 Sofie、th-TH泰文 (泰國) 的 Niwat、tr-TR土耳其文 (土耳其) 的 Ahmet、vi-VN越南文 (越南) 的 NamMinh、zh-TW繁體中文 (台灣) 的 HsiaoChen、zh-TW繁體中文 (台灣) 的 YunJhe、zh-HK中文，廣東話 (香港特別行政區) 的 HiuMaan 和zh-HK中文，廣東話 (香港特別行政區) 的 WanLung。
預覽版地區設定中的 5 種語音：et-EE愛沙尼亞文 (愛沙尼亞) 的 Kert、ga-IE愛爾蘭文 (愛爾蘭) 的 Colm、lv-LV拉脫維亞文 (拉脫維亞) 的 Nils、lt-LT立陶宛文 (立陶宛) 的 Leonas 和mt-MT馬爾他文 (馬爾他) 的 Joseph。

在此版本中，我們目前支援涵蓋 54 個語言 / 地區設定的 129 種神經語音。此外，49 個語言 / 地區設定中提供超過 70 種標準語音。請造訪語言支援查看完整清單。

音訊內容建立的更新

使用語音類別和詳細的語音描述來改善語音選擇 UI。
對不同語言的所有神經語音啟用語調微調。
根據瀏覽器的語言自動進行 UI 當地語系化。
已啟用所有 zh-CN 神經語音的 StyleDegree 控制。請造訪語音內容建立工具以查看新功能。

繁體-簡體語音的更新

已更新所有 zh-CN 神經語音，以支援英文口說。
已啟用所有 zh-CN 神經語音以支援語調調整。 SSML 或音訊內容建立工具可以用於調整出最佳的語調。
已更新所有 zh-CN 多風格神經語音，以支援 StyleDegree 控制。可以調整表情強度 (柔和或強烈)。
已更新 zh-CN-YunyeNeural 為可支援多個可執行不同表情的風格。

2020 年 11 月版本

預覽版中的新地區設定和語音

類神經文字轉換語音組合引進五種新的語音和語言。這些語音為：馬爾他文 (馬爾他) 的 Grace、立陶宛文 (立陶宛) 的 Ona、愛沙尼亞文 (愛沙尼亞) 的 Anu、愛爾蘭文 (愛爾蘭) 的 Orla 和拉脫維亞文 (拉脫維亞) 的 Everita。
5 種新的 zh-CN 語音搭配多種風格和角色支援：Xiaohan、Xiaomo、Xiaorui、Xiaoxuan 和 Yunxi。

這些語音在三個 Azure 區域中都提供公開預覽：EastUS、SouthEastAsia 和 WestEurope。

類神經文字轉換語音容器正式發行

使用類神經文字轉換語音容器時，開發人員可以在自身的環境中，使用最自然的數位語音來執行語音合成，以滿足特定的安全性和資料治理需求。請參閱如何安裝語音容器。

新功能

自訂語音：已啟用的使用者將語音模型從一個區域複製到另一個區域；支援的端點暫停和繼續。移至此處的入口網站。
SSML 靜音標籤支援。
一般 TTS 語音品質改善：已改善 nb-NO 中文字層級的發音精確性。減少 53% 的發音錯誤。

於此技術部落格閱讀更多資訊。

2020 年 10 月版本

新功能

Jenny 支援新的 newscast 風格。請參閱如何使用 SSML 中的說話風格。
神經語音已升級為 HiFiNet 聲碼器，具有更高的音訊精確度及更快速的合成速度。這有助客戶的案例是依賴 Hi-Fi 音訊或長時間的互動，包括影片配音、有聲書或線上教育教材。在我們的技術社群部落格深入了解有關故事和聆聽語音樣本
自訂語音與音訊內容建立工作室已在 17 個地區設定中完成當地語系化。使用者可以輕鬆地將 UI 切換為當地語言，以提供更友善的體驗。
音訊內容建立：已新增 XiaoxiaoNeural 的風格程度控制；已精簡自訂中斷風格，以包括 50ms 的增量中斷。

一般 TTS 語音品質改善

已改善 pl-PL (錯誤率降低：51%) 和 fi-FI (錯誤率降低：58%) 中文字層級精確性
已改善字典案例 ja-JP 單一字組讀取。減少 80% 的發音錯誤。
zh-CN-XiaoxiaoNeural：已改善的情緒 / 自訂服務 / 新聞廣播 / 歡快 / 生氣風格語音品質。
zh-CN：以改善 Erhua 發音和輕柔的語調，並精簡韻律空間，大幅改善理解性。

2020 年 9 月版本

新功能

類神經文字轉換語音
- 已擴充為支援 18 種新的語言 / 地區設定。 這些語言為保加利亞文、捷克文、德文 (奧地利)、德文 (瑞士)、希臘文、英文 (愛爾蘭)、法文 (瑞士)、希伯來文、克羅埃西亞文、匈牙利文、印尼文、馬來文、羅馬尼亞文、斯洛伐克文、斯洛伐克文、斯洛維尼亞文、坦米爾文、泰盧固文和越南文。
- 已發行 14 種新語音，以豐富現有語言的多樣性。 請參閱完整語言和語音清單。
- en-US 和 zh-CN 語音的新口說風格。 英文 (美國) 的新語音 Jenny 支援聊天機器人、客戶服務和助理樣式。我們的 zh-CN 語音 XiaoXiao 提供 10 種新的口說風格。此外，XiaoXiao 神經語音支援 StyleDegree 微調。請參閱如何使用 SSML 中的說話風格。
容器：在公開預覽版本中發行的類神經文字轉換語音容器，提供 14 種語言的 16 種語音。 深入了解如何部署適用於類神經文字轉換語音的語音容器

請參閱Ignite 2020 完整的 TTS 更新公告

2020 年 8 月版本

新功能

類神經文字轉換語音：新的en-US Aria 語音說話風格。 AriaNeural 在閱讀新聞時，聽起來就像新聞廣播員。「新聞廣播 - 正式」風格聽起來較嚴肅，而「新聞廣播 - 休閒」風格比較放鬆且非正式。請參閱如何使用 SSML 中的說話風格。
自訂語音：發行新的功能，以自動檢查定型資料的品質。當您上傳資料時，系統會檢查音訊和轉錄資料的各個層面，並自動修正或篩選問題，以改善語音模型的品質。這涵蓋語音的音量、雜訊等級、語音的發音精確性、具有標準化文字的語音校準、音訊靜音，以及音訊和腳本的格式。
音訊內容建立：可讓您啟用更強大的語音微調和音訊管理功能的一組新功能。
- 發音：發音微調功能已更新為最新的音位集。您可以從程式庫挑選正確的音位元素，並簡化您所選取文字的發音。
- 下載：音訊「下載」 / 「匯出」功能已增強，可支援依段落產生音訊。您可以在相同的檔案 / SSML 中編輯內容，同時產生多個音訊輸出。 [下載] 的檔案結構也會進行精簡。現在，您可以輕鬆地從一個資料夾中取得所有音訊檔案。
- 工作狀態：已改善多檔案匯出體驗。過去您在匯出多個檔案時，如果其中一個檔案失敗，則整個工作將會失敗。但現在，所有其他檔案都會成功匯出。工作報表會以更詳細的結構化資訊進行擴充。現在您可以使用報表檢查所有失敗檔案和句子的記錄。
- SSML 文件：連結到 SSML 文件，有助於您檢查如何使用所有微調功能的規則。
語音清單 API 已更新為包括方便使用的顯示名稱和神經語音支援的說話風格。

一般 TTS 語音品質改善

降低文字層級發音錯誤的百分比：ru-RU (錯誤降低 56%) 和 sv-SE (錯誤降低 49%)
已改善 en-US 神經語音複音文字讀取達 40%。複音文字的範例，包括「閱讀」、「生活」、「紀錄」和「物體」等。
已改善 fr-FR 中問題語氣自然性的問題。 MOS (平均評價計分) 取得：+0.28
已更新下列語音的聲碼器，並提供精確度改善和整體效能提升 40%。

地區設定語音

en-GB Mia

es-MX Dalia

fr-CA Sylvie

fr-FR Denise

ja-JP Nanami

ko-KR Sun-Hi

地區設定	語音
`en-GB`	Mia
`es-MX`	Dalia
`fr-CA`	Sylvie
`fr-FR`	Denise
`ja-JP`	Nanami
`ko-KR`	Sun-Hi

錯誤修正

使用音訊內容建立工具修正多個 BUG
- 已修正自動重新整理的問題。
- 已修正在南東亞地區 zh-CN 語音樣式的問題。
- 已修正穩定性問題，包括具有「中斷」標記的匯出錯誤，以及標點符號中的錯誤。

2024 年 6 月版本

語音轉換文字 REST API v3.2 正式發行

語音轉換文字 REST API 3.2 版現已正式推出。如需語音轉換文字 REST API v3.2 的詳細資訊，請參閱語音轉換文字 REST API v3.2 參考文件和語音轉換文字 REST API 指南。

注意

2024 年 9 月將會移除預覽版 3.2-preview.1 和 3.2-preview.2*。

語音轉換文字 REST API v3.1 將在宣佈的日期淘汰。語音轉換文字 REST API v3.0 將於 2026 年 4 月 1 日淘汰。如需關於升級的詳細資訊，請參閱語音轉換文字 REST API v3.0 至 v3.1，以及 v3.1 至 v3.2 移轉指南。

5 月 (2024) 版本

影片翻譯 (預覽)

現在可在公開預覽版中使用影片翻譯。影片翻譯這項 Azure AI 語音的功能，讓您自動順暢翻譯及產生多種語言的影片。這項功能旨在協助您當地語系化影片內容，以滿足全球不同受眾的需求。您可以有效率地跨各種使用案例建立沉浸式當地語系化影片，例如 Vlog、教育、新聞、企業訓練、廣告、電影、電視節目等等。如需詳細資訊，請參閱影片翻譯概觀。

發音評定

語音發音評量現在支援 24 種通用語言 (新增了一種語言)，另外還有 7 種語言可供公開預覽版使用。如需詳細資訊，請參閱發音評定的完整語言清單。

語言	地區設定 (BCP-47)
阿拉伯文 (埃及)	`ar-EG`¹
阿拉伯文 (沙烏地阿拉伯)	`ar-SA`
加泰蘭文	`ca-ES`¹
中文 (廣東話，繁體)	`zh-HK`¹
中文 (國語，簡體)	`zh-CN`
中文 (國語，繁體)	`zh-TW`¹
荷蘭文 (荷蘭)	`nl-NL`
英文 (澳大利亞)	`en-AU`
英文 (加拿大)	`en-CA`
英文 (印度)	`en-IN`
英文 (英國)	`en-GB`
英文 (美國)	`en-US`
芬蘭文 (芬蘭)	`fi-FI`¹
法文 (加拿大)	`fr-CA`
法文 (法國)	`fr-FR`
德文 (德國)	`de-DE`
印度文 (印度)	`hi-IN`
義大利文 (義大利)	`it-IT`
日文 (日本)	`ja-JP`
韓文 (韓國)	`ko-KR`
馬來文 (馬來西亞)	`ms-MY`
巴克摩挪威文 (挪威)	`nb-NO`
波蘭文 (波蘭)	`pl-PL`¹
葡萄牙文 (巴西)	`pt-BR`
葡萄牙文 (葡萄牙)	`pt-PT`¹
俄文 (俄羅斯)	`ru-RU`
西班牙文 (墨西哥)	`es-MX`
西班牙文 (西班牙)	`es-ES`
瑞典文 (瑞典)	`sv-SE`
坦米爾文 (印度)	`ta-IN`
越南文 (越南)	`vi-VN`

¹ 語言處於公開預覽狀態以便進行發音評估。

2024 年 4 月版本

自動多語言語音翻譯 (預覽)

公開預覽版提供自動多語言語音翻譯。這項創新的功能徹底改變了克服語言障礙的方式，為各種語言環境之間的順暢通訊提供無與倫比的功能。

重點摘要

未指定的輸入語言：多語言語音翻譯可以接收各種語言的音訊，而且不需要指定預期的輸入語言。它可讓您在不需要預先設定的情況下，即可跨全球環境理解和協作，是一項寶貴的功能。
語言切換：多語言語音翻譯允許在相同的工作階段期間說出多種語言，並將它們全部翻譯成相同的目標語言。輸入語言變更或您執行任何其他操作時，不需要重新啟動工作階段。

運作方式

旅遊翻譯：多語言語音翻譯可以透過為遊客提供慣用語言的資訊和協助，來增強遊客到國外旅遊的體驗。飯店禮賓服務、導遊和遊客中心可以利用這項技術來滿足各種語言需求。
國際會議：多語言語音翻譯可以透過即時翻譯字幕，方便來自不同地區、可能講多種語言的與會者之間的交流。出席者可以使用母語發言，無需指定，以確保順暢地理解和共同作業。
教育會議：在多元文化的課堂或線上學習環境中，多語言語音翻譯可以支援學生和教師之間的語言多樣性。它允許順暢的溝通和參與，而不需要指定每個學生或講師的語言。

如何存取

如需詳細簡介，請瀏覽語音翻譯概觀。此外，您可以參考如何翻譯語音的程式碼範例。從 1.37.0 版起的所有 SDK 版本，都完整支援這項新功能。

使用自動分段標記的即時語音轉換文字 (正式發行)

使用自動分段標記的即時語音轉換文字現已正式推出。

您可以建立語音轉換文字應用程式，以使用自動分段標記來區分參與交談的不同說話者。如需即時自動分段標記的詳細資訊，請參閱即時自動分段標記快速入門。

語音轉換文字模型更新

即時語音轉換文字已發行具有雙語功能的新模型。 en-IN 模型現在同時支援英文和印度語雙語案例，並提供更高的正確性。阿拉伯地區設定 (ar-AE、ar-BH、ar-DZ、ar-IL、ar-IQ、ar-KW、ar-LB、ar-LY、ar-MA、ar-OM、ar-PS、ar-QA、ar-SA、ar-SY、ar-TN、ar-YE) 現在都具備英語雙語支援，增強正確性和客服中心支援。

批次謄寫為模型提供了適用於以下地區設定的新架構：es-ES、es-MX、fr-FR、it-IT、ja-JP、ko-KR、pt-BR 和 zh-CN。這些模型可大幅增強可讀性和實體辨識。

2024 年 3 月版本

Whisper 正式發行 (GA)

現在已正式推出使用 Azure AI 語音的 Whisper 語音轉換文字模型。

請參閱什麼是 Whisper 模型？深入了解何時使用 Azure AI 語音與Azure OpenAI 服務。

2024 年 2 月版本

發音評定

語音發音評量現在支援 23 種通用語言 (新增了 5 種語言)，另外還有 3 種語言可供公開預覽版使用。如需詳細資訊，請參閱發音評定的完整語言清單。

片語清單

已新增下列地區設定的片語清單支援：ar-SA、de-CH、en-IE、en-ZA、es-US、id-ID、nl-NL、pl-PL、pt-PT、ru-RU、sv-SE、th-TH、vi-VN、zh-HK、zh-TW。

2023 年 11 月版本

嶄新推出雙語語音模型！

我們很高興能推出即時語音建模的重大功能 - 雙語語音建模。這項重大增強功能可讓我們的語音模型順暢地支援雙語語言組，例如英文和西班牙文，以及英文和法文。此功能可讓使用者在即時互動期間輕鬆切換語言，這標誌著我們致力於增強溝通體驗的關鍵時刻。

重點摘要：

雙語支援：透過我們最新版本，使用者可以在即時語音互動中順暢地在英文與西班牙文之間切換，或在英文與法文之間切換。這項功能是專為適應經常在兩種語言之間轉換的雙語使用者量身打造。
增強使用者體驗：雙語使用者，無論是在工作、家庭或各種社群環境中，都會發現這項功能非常有用。模型能夠即時理解和回應英文和西班牙文，為有效和流暢的溝通開闢了新的可能性。

使用方式：

您呼叫語音服務 API 或在 Speech Studio 上試用時，請選擇 es-US (西班牙文和英文) 或 fr-CA (法文和英文)。您可以隨意說出任一種語言，或將它們混合在一起；此模型的設計目的是要動態調整，以這兩種語言提供精確且內容感知的回應。

是時候透過我們最新發佈的功能來提升您的溝通；順暢、隨手可得的多語系溝通！

語音轉換文字模型更新

我們很高興能大幅更新語音模型、提升正確性、改善可讀性及改進實體辨識。此次升級提供強大的新結構，由擴充的訓練資料集所支援，可確保整體效能明顯提升。它包含 en-US、zh-CN、ja-JP、it-IT、pt-BR、es-MX、es-ES、fr-FR、de-DE、ko-KR、tr-TR、sv-SE 和 he-IL 的新發行模型。

醒目提示：

新模型結構的正確性更高：重新定義的模型結構，加上更豐富的定型資料集，提高了正確性程度，有望實現更精確的語音輸出。
可讀性改進：我們最新的模型可讀性大幅提升，增強了語音內容的連貫性和清晰度。
進階實體辨識：實體辨識大幅升級，從而產生更精確且細微的結果。

潛在影響：儘管有這些進展，但請務必注意潛在影響：

自訂靜音逾時功能：採用自訂靜音逾時的使用者 (特別是設定較低的使用者)，可能會遇到單字片語的過度分割和潛在的遺漏。
新的模型可能會顯示關鍵字前置詞功能的相容性問題，建議使用者評估其特定應用程式中的效能。
減少不流暢的字組或片語：使用者可能會注意到語音輸出中的 "um" 或 "uh" 等片語的減少。
字組時間戳記持續時間不準確：某些不流暢的字組可能會在時間戳記持續時間中顯示不準確，在依賴精確計時的應用程式中需要特別注意。
信賴度分數分佈差異：依賴信賴度分數和相關閾值的使用者應該意識到分佈的潛在變化，從而需要進行調整以獲得最佳效能。
片語清單特徵的正確性增強，可能會受到某些片語誤認的影響。

我們鼓勵您探索這些改進功能，並考慮順暢轉換的潛在問題，而且一如往常，您的意見反應有助於完善和推進我們的服務。

發音評定

語音發音評量現在支援 18 種通用語言，另外還有 6 種語言可供公開預覽版使用。如需詳細資訊，請參閱發音評定的完整語言清單。
我們很高興宣佈自 2023 年 11 月 1 日起，發音評量引進新功能：韻律、文法、詞彙和主題。這些增強功能旨在為閱讀和口語評量提供更全面的語言學習體驗。升級至 SDK 1.35.0 版或更新版本，以在如何使用發音評量和 Speech Studio 中的發音評量中探索更多詳細資料。

2023 年 9 月發行版本

Whisper 公開預覽

Azure AI 語音現在透過批次謄寫 API 支援 OpenAI 的 Whisper 模型。若要深入瞭解，請參閱建立批次謄寫指南。

注意

Azure OpenAI 服務也支援 OpenAI 的 Whisper 模型，透過同步 REST API 進行語音轉換文字。如需詳細資訊，請參閱快速入門。

請參閱什麼是 Whisper 模型？深入瞭解何時使用 Azure AI 語音與Azure OpenAI 服務。

語音轉換文字 REST API v3.2 公開預覽

語音轉換文字 REST API v3.2 現已推出預覽版。語音轉換文字 REST API v3.1 已正式推出。語音轉換文字 REST API v3.0 將於 2026 年 4 月 1 日淘汰。如需詳細資訊，請參閱語音轉換文字 REST API v3.0 至 v3.1，以及 v3.1 至 v3.2 移轉指南。

2023 年 8 月版本

新的語音轉換文字地區設定：

語音轉換文字支援兩個新的地區設定，如下表所示。請參閱這裡的完整語言清單。

地區設定	語言
`pa-IN`	旁遮普文 (印度)
`ur-IN`	烏都文 (印度)

發音評定

語音發音評估現在支援 3 種語言，正式推出英文 (加拿大)、英文 (印度)，以及法文 (加拿大)，預覽版提供 3 種語言。如需詳細資訊，請參閱發音評定的完整語言清單。

2023 年 5 月版本

發音評定

語音發音評估現在支援 3 種其他語言，正式推出德文 (德國)、日文 (日本) 和西班牙文 (墨西哥)，預覽版提供 4 種語言。如需詳細資訊，請參閱發音評定的完整語言清單。
您現在可以使用標準語音轉換文字承諾層來評估所有公用區域的發音。如果您購買標準語音轉換文字的承諾層，發音評量的費用會達到承諾用量。請參閱承諾用量層定價。

2023 年 2 月版本

發音評定

語音發音評估現在支援 5 種其他語言，正式推出英文 (英國)、英文 (澳洲)、法文 (法國)、西班牙文 (西班牙)，以及中文 (中文、簡體中文)，以及預覽提供其他語言。
已新增範例程式碼，示範如何在您自己的應用程式中以串流模式使用發音評定。
- C#：請參閱範例程式碼。
- C++：請參閱範例程式碼。
- JAVA：請參閱範例程式碼。
- JavaScript：請參閱範例程式碼。
- Objective-C：請參閱範例程式碼。
- Python：請參閱範例程式碼。
- Swift：請參閱範例程式碼。

自訂語音

系統會針對 de-AT 地區設定新增音訊 + 人工標記文字記錄的支援。

2023 年 1 月版本

自訂語音

針對其他地區設定新增音訊 + 人工標記文字記錄的支援：ar-BH、ar-DZ、ar-EG、ar-MA、ar-SA、ar-TN、ar-YE 和 ja-JP。

已針對地區設定 de-AT 新增結構化文字調適的支援。

2022 年 12 月版本

語音轉換文字 REST API

語音轉換文字 REST API 3.1 版已正式推出。語音轉換文字 REST API 版本 3.0 將會淘汰。如需如何移轉的詳細資訊，請參閱指引。

2022 年 10 月版本

新的語音轉換文字地區設定

已新增 ml-IN 地區設定對馬來亞拉姆文 (印度) 的支援。請參閱這裡的完整語言清單。

2022 年 7 月版本

新的語音轉換文字地區設定：

已新增 7 個新的地區設定，如下表所示。請參閱這裡的完整語言清單。

地區設定	語言
`bs-BA`	波士尼亞文 (波士尼亞赫塞哥維納)
`yue-CN`	中文 (廣東話，簡體)
`zh-CN-sichuan`	中文 (西南官話，簡體)
`wuu-CN`	中文 (吳語，簡體)
`ps-AF`	普什圖文 (阿富汗)
`so-SO`	索馬利文 (索馬利亞)
`cy-GB`	威爾斯文 (英國)

2022 年 6 月版本

新的語音轉換文字地區設定：

已新增 10 個新的地區設定，如下表所示。請參閱這裡的完整語言清單。

地區設定	語言
`sq-AL`	阿爾巴尼亞文 (阿爾巴尼亞)
`hy-AM`	亞美尼亞文 (亞美尼亞)
`az-AZ`	亞塞拜然文 (亞塞拜然)
`eu-ES`	巴斯克文
`gl-ES`	加利西亞文
`ka-GE`	喬治亞文 (喬治亞)
`it-CH`	義大利文 (瑞士)
`kk-KZ`	哈薩克文 (哈薩克)
`mn-MN`	蒙古文 (蒙古)
`ne-NP`	尼泊爾文 (尼泊爾)

2022 年 4 月版本

新的語音轉換文字地區設定：

以下是新增的地區設定清單。請參閱這裡的完整語言清單。

地區設定	語言
`bn-IN`	孟加拉文 (印度)

2022 年 1 月版本

新的語音轉換文字地區設定：

以下是新增的地區設定清單。請參閱這裡的完整語言清單。

地區設定	語言
`af-ZA`	南非荷蘭文 (南非)
`am-ET`	阿姆哈拉文 (衣索比亞)
`de-CH`	德文 (瑞士)
`fr-BE`	法文 (比利時)
`is-IS`	冰島文 (冰島)
`jv-ID`	爪哇文 (印尼)
`km-KH`	高棉文 (柬埔寨)
`kn-IN`	坎那達文 (印度)
`lo-LA`	寮文 (寮國)
`mk-MK`	馬其頓文 (北馬其頓)
`my-MM`	緬甸文 (緬甸)
`nl-BE`	荷蘭文 (比利時)
`si-LK`	僧伽羅文 (斯里蘭卡)
`sr-RS`	塞爾維亞文 (塞爾維亞)
`sw-TZ`	史瓦希里文 (坦尚尼亞)
`uk-UA`	烏克蘭文 (烏克蘭)
`uz-UZ`	烏茲別克文 (烏茲別克)
`zu-ZA`	祖魯文 (南非)

2021 年 7 月版本

新的語音轉換文字地區設定：

以下是新增的地區設定清單。請參閱這裡的完整語言清單。

地區設定	語言
`ar-DZ`	阿拉伯文 (阿爾及利亞)
`ar-LY`	阿拉伯文 (利比亞)
`ar-MA`	阿拉伯文 (摩洛哥)
`ar-TN`	阿拉伯文 (突尼西亞)
`ar-YE`	阿拉伯文 (葉門)
`bg-BG`	保加利亞文 (保加利亞)
`el-GR`	希臘文 (希臘)
`et-EE`	愛沙尼亞文 (愛沙尼亞)
`fa-IR`	波斯文 (伊朗)
`ga-IE`	愛爾蘭文 (愛爾蘭)
`hr-HR`	克羅埃西亞文 (克羅埃西亞)
`lt-LT`	立陶宛文 (立陶宛)
`lv-LV`	拉脫維亞文 (拉脫維亞)
`mt-MT`	馬爾他文 (馬爾他)
`ro-RO`	羅馬尼亞文 (羅馬尼亞)
`sk-SK`	斯洛伐克文 (斯洛伐克)
`sl-SI`	斯洛維尼亞文 (斯洛維尼亞)
`sw-KE`	斯瓦希里文 (肯亞)

2021 年 1 月版本

新的語音轉換文字地區設定：

以下是新增的地區設定清單。請參閱這裡的完整語言清單。

地區設定	語言
`ar-AE`	阿拉伯文 (阿拉伯聯合大公國)
`ar-IL`	阿拉伯文 (以色列)
`ar-IQ`	阿拉伯文 (伊拉克)
`ar-OM`	阿拉伯文 (阿曼)
`ar-PS`	阿拉伯文 (巴勒斯坦民族權力機構)
`de-AT`	德文 (奧地利)
`en-GH`	英文 (迦納)
`en-KE`	英文 (肯亞)
`en-NG`	英文 (奈及利亞)
`en-TZ`	英文 (坦尚尼亞)
`es-GQ`	西班牙文 (赤道幾內亞)
`fil-PH`	菲律賓文 (菲律賓)
`fr-CH`	法文 (瑞士)
`he-IL`	希伯來文 (以色列)
`id-ID`	印尼文 (印尼)
`ms-MY`	馬來文 (馬來西亞)
`vi-VN`	越南文 (越南)

2020 年 8 月版本

新的語音轉換文字地區設定：

語音轉換文字已於 8 月發行 26 個新的地區設定：2 種歐洲語言 (cs-CZ 和 hu-HU)；涵蓋大部分的南美洲國家/地區的 5 個英文地區設定和 19 個西班牙文地區設定。以下是新增的地區設定清單。請參閱這裡的完整語言清單。

地區設定	語言
`cs-CZ`	捷克文 (捷克共和國)
`en-HK`	英文 (香港特別行政區)
`en-IE`	英文 (愛爾蘭)
`en-PH`	英文 (菲律賓)
`en-SG`	英文 (新加坡)
`en-ZA`	英文 (南非)
`es-AR`	西班牙文 (阿根廷)
`es-BO`	西班牙文 (玻利維亞)
`es-CL`	西班牙文 (智利)
`es-CO`	西班牙文 (哥倫比亞)
`es-CR`	西班牙文 (哥斯大黎加)
`es-CU`	西班牙文 (古巴)
`es-DO`	西班牙文 (多明尼加)
`es-EC`	西班牙文 (厄瓜多)
`es-GT`	西班牙文 (瓜地馬拉)
`es-HN`	西班牙文 (宏都拉斯)
`es-NI`	西班牙文 (尼加拉瓜)
`es-PA`	西班牙文 (巴拿馬)
`es-PE`	西班牙文 (秘魯)
`es-PR`	西班牙文 (波多黎各)
`es-PY`	西班牙文 (巴拉圭)
`es-SV`	西班牙文 (薩爾瓦多)
`es-US`	西班牙文 (美國)
`es-UY`	西班牙文 (烏拉圭)
`es-VE`	西班牙文 (委內瑞拉)
`hu-HU`	匈牙利文 (匈牙利)

2024 年 2 月版本

新增最新模型版本的支援。

自訂語音轉換文字 4.6.0
語音轉換文字 4.6.0
神經文字轉換語音 3.1.0

將語音轉換文字元件升級至最新版本。將所有 es 地區設定模型升級至最新版本。增加語音轉換文字使用案例的媒體轉換緩衝區。

2023 年 11 月版本

新增最新模型版本的支援。

自訂語音轉換文字 4.5.0
語音轉換文字 4.5.0
神經文字轉換語音 2.19.0

2023 年 10 月版本

新增最新模型版本的支援。

自訂語音轉換文字 4.4.0
語音轉換文字 4.4.0
神經文字轉換語音 2.18.0

修正一系列高風險事件弱點問題。

移除容器中的備援記錄。

將內部媒體元件升級至最新版本。

新增語音 en-IN-NeerjaNeural 的支援。

2023 年 9 月版本

新增最新模型版本的支援。

語音語言識別 1.12.0
自訂語音轉換文字 4.3.0
語音轉換文字 4.3.0
神經文字轉換語音 2.17.0

將自訂語音轉換文字和語音轉換文字升級至最新的架構。

修正弱點問題。

新增語音 ar-AE-FatimaNeural 的支援。

2023 年 7 月版本

新增最新模型版本的支援。

自訂語音轉換文字 4.1.0
語音轉換文字 4.1.0
類神經文字轉換語音 2.15.0

使用本機自訂模型檔案，修正透過 docker 掛接選項執行語音轉換文字容器的問題。

修正在某些情況下， RECOGNIZING 事件不會透過語音 SDK 顯示回應的問題。

修正弱點問題。

2023 年 6 月版本

新增最新模型版本的支援。

自訂語音轉換文字 4.0.0
語音轉換文字 4.0.0
類神經文字轉換語音 2.14.0

內部部署語音轉換文字影像會升級至 .NET 6.0

升級地區設定的顯示模型，包括 en-us、ar-eg、ar-bhja-jp、ko-kr 等等。

升級語音轉換文字容器元件，以解決弱點問題。

新增地區設定語音 de-DE-AmalaNeural、de-AT-IngridNeural、de-AT-JonasNeural 和 en-US-JennyMultilingualNeural 的支援

2023 年 5 月版本

新增最新模型版本的支援。

自訂語音轉換文字 3.14.0
語音轉換文字 3.14.0
類神經文字轉換語音 2.13.0

修正 he-IL 標點符號問題

修正弱點問題

新增地區設定語音 en-US-MichelleNeural 和 es-MX-CandelaNeural

2023 年 4 月版本

安全性更新

修正弱點問題

2023 年 3 月版本

新增最新模型版本的支援。

自訂語音轉換文字 3.12.0
語音轉換文字 3.12.0
語音語言識別 1.11.0
類神經文字轉換語音 2.11.0

修正弱點問題

修正 tr-TR 大寫問題

升級語音轉換文字 en-US 顯示模式

將預先建置的類神經文字支援新增至語音地區設定語音 ar-AE-HamdanNeural

2023 年 2 月版本

新的容器版本

新增最新模型版本的支援：

自訂語音轉換文字 3.11.0
語音轉換文字 3.11.0
類神經文字到語音 2.10.0

修正弱點問題

語音模型的一般升級

新增 Abraic 地區設定：

ar-IL
ar-PS

升級希伯來文和土耳其文顯示模式

2023 年 1 月版本

新的容器版本

新增最新模型版本的支援：

自訂語音轉換文字 3.10.0
語音轉換文字 3.10.0
類神經文字轉換語音 2.9.0

修正假設模式問題

修正 HTTP Proxy 問題

自訂語音轉換文字容器中斷連線模式

將 CNV 已中斷連線的容器支援新增至 TTS 前端

新增這些地區設定的支援：

da-DK-ChristelNeural
da-DK-JeppeNeural
en-IN-PrabhatNeural

2022 年 12 月版本

新的容器版本

新增最新模型版本的支援：

自訂語音轉換文字 3.9.0
語音轉換文字 3.9.0
類神經文字轉換語音 2.8.0

修正 ipv4/ipv6 問題

修正弱點問題

2022 年 11 月版本

新的容器版本

新增最新模型版本的支援：

自訂語音轉換文字 3.8.0
語音轉換文字 3.8.0
類神經文字轉換語音 2.7.0

2022 年 10 月版本

新的容器版本

新增最新模型版本的支援：

自訂語音轉換文字 3.7.0
語音轉換文字 3.7.0
類神經文字轉換語音 2.6.0

2022 年 9 月版本

語音轉換文字 3.6.0-amd64

新增最新模型版本的支援。

新增這些地區設定的支援：

az-az
bn-in
bs-ba
cy-gb
eu-es
fa-ir
gl-es
he-il
hy-am
it-ch
ka-ge
kk-kz
mk-mk
mn-mn
ne-np
ps-af
so-so
sq-al
wuu-cn
yue-cn
zh-cn-sichuan

定期每月更新，包括安全性升級和弱點修正。

自訂語音轉換文字 3.6.0-amd64

定期每月更新，包括安全性升級和弱點修正。

類神經文字轉換語音 v2.5.0

新增這些預建神經語音的支援：

az-az-babekneural
az-az-banuneural
fa-ir-dilaraneural
fa-ir-faridneural
fil-ph-angeloneural
fil-ph-blessicaneural
he-il-avrineural
he-il-hilaneural
id-id-ardineural
id-id-gadisneural
ka-ge-ekaneural
ka-ge-giorgineural

定期每月更新，包括安全性升級和弱點修正。

2022 年 5 月版本

語音語言偵測容器 v1.9.0-amd64-preview

語音語言偵測的 Bug 修正。

2022 年 3 月版本

自訂語音轉換文字容器 v3.1.0

新增支援以取得顯示模型。

2022 年 1 月版本

語音轉換文字容器 v3.0.0

新增在中斷連線的環境中使用容器的支援。

語音轉換文字容器 v2.18.0

定期每月更新，包括安全性升級和弱點修正。

類神經文字轉換語音容器 v1.12.0

新增這些預建神經語音的支援：am-et-amehaneural、am-et-mekdesneural、so-so-muuseneural 和 so-so-ubaxneural。

定期每月更新，包括安全性升級和弱點修正。

分享方式：

Azure AI 語音有何新功能？

最近醒目提示

版本資訊

即將推出的 Linux 和 Android 使用者方案：

語音 SDK 1.38.0：2024 年 6 月版本

新功能

錯誤修正

範例

語音 SDK 1.37.0：2024 年 4 月版本

新功能

錯誤修正

範例

語音 SDK 1.36.0：2024 年 3 月版本

新功能

錯誤修正

範例

語音 SDK 1.35.0：2024 年 2 月版本

新功能

錯誤修正

範例

語音 SDK 1.34.1：2024 年 1 月版本

重大變更

新功能

錯誤修正

語音 SDK 1.34.0：2023 年 11 月版本

重大變更

新功能

錯誤修正

範例

語音 CLI 1.34.0：2023 年 11 月版本

新功能

錯誤修正

語音 SDK 1.33.0：2023 年 10 月版本

中斷性變更通知

新功能

錯誤修正

範例

語音 CLI 1.33.0：2023 年 10 月版本

新功能

錯誤修正

語音 SDK 1.32.1：2023 年 9 月版本

錯誤修正

範例

語音 SDK 1.31.0：2023 年 8 月版本

新功能

重大變更

錯誤修正

範例

語音 SDK 1.30.0：2023 年 7 月版本

新功能

錯誤修正

其他注意事項

範例

語音 SDK 1.29.0：2023 年 6 月版本

新功能

錯誤修正

範例

語音 SDK 1.28.0：2023 年 5 月版本

重大變更

新功能

錯誤修正

範例

語音 SDK 1.27.0：2023 年 4 月版本

即將進行的變更通知

新功能

錯誤修正

範例

語音 SDK 1.26.0：2023 年 3 月版本

重大變更

新功能

錯誤修正

範例

語音 SDK 1.25.0：2023 年 1 月版本

重大變更

新功能

錯誤修正

範例

語音 SDK 1.24.2：2022 年 11 月版本

新功能