speech 套件
適用于 Python 的 Microsoft 語音 SDK
單元
audio |
與處理各種辨識器音訊輸入相關的類別,以及語音合成器的音訊輸出。 |
dialog |
與對話方塊服務連接器相關的類別。 |
enums |
適用于 Python 的 Microsoft 語音 SDK |
intent |
與語音辨識意圖相關的類別。 |
interop |
適用于 Python 的 Microsoft 語音 SDK |
languageconfig |
與語言組態處理相關的類別 |
properties |
適用于 Python 的 Microsoft 語音 SDK |
speech |
與辨識語音中的文字、從文字合成語音,以及各種辨識器中使用的一般類別相關的類別。 |
transcription |
與交談轉譯相關的類別。 |
translation |
與語音翻譯至其他語言相關的類別。 |
version |
適用于 Python 的 Microsoft 語音 SDK |
類別
AudioDataStream |
表示用來以資料流程方式操作音訊資料的音訊資料流程。 從語音合成結果產生音訊資料流程, (類型 SpeechSynthesisResult) 或關鍵字辨識結果 (類型 KeywordRecognitionResult) 。 |
AutoDetectSourceLanguageResult |
表示自動偵測來來源語言結果。 您可以從語音辨識結果初始化結果。 |
CancellationDetails |
適用于 Python 的 Microsoft 語音 SDK |
Connection |
用來管理所指定 Recognizer 之語音服務的連線的 Proxy 類別。 根據預設,會 Recognizer 視需要自動管理服務的連線。 類別 Connection 會提供其他方法,讓使用者明確開啟或關閉連線,以及訂閱線上狀態變更。 您可以選擇使用或不使用 Connection。 它適用于需要根據線上狀態微調應用程式行為的案例。 使用者可以選擇性地呼叫 open 以手動起始服務連線,再開始辨識 Recognizer 與此 Connection 相關聯的 。 啟動辨識之後,呼叫 open 或 close 可能會失敗。 這不會影響辨識器或進行中的辨識。 連線可能會因為各種原因而中斷,辨識器一律會嘗試視需要重新建立連線,以確保進行中的作業。 在所有情況下, connected/disconnected 事件都會指出線上狀態的變更。 注意 已在 1.17.0 版中更新。 用於內部使用的建構函式。 |
ConnectionEventArgs |
提供 ConnectionEvent 的資料。 注意 已在 1.2.0 版中新增 用於內部使用的建構函式。 |
EventSignal |
用戶端可以連線到事件訊號來接收事件,或中斷事件訊號的連線,以停止接收事件。 用於內部使用的建構函式。 |
KeywordRecognitionEventArgs |
關鍵字辨識事件引數的類別。 用於內部使用的建構函式。 |
KeywordRecognitionModel |
表示關鍵字辨識模型。 |
KeywordRecognitionResult |
關鍵字辨識作業的結果。 用於內部使用的建構函式。 |
KeywordRecognizer |
關鍵字辨識器。 |
NoMatchDetails |
適用于 Python 的 Microsoft 語音 SDK |
PhraseListGrammar |
類別,允許執行時間新增片語提示來協助語音辨識。 新增至辨識器的片語會在下一次辨識開始時生效,或下次語音辨識器必須重新連線到語音服務時生效。 注意 已在 1.5.0 版中新增。 用於內部使用的建構函式。 |
PronunciationAssessmentConfig |
代表發音評估組態 注意 已在 1.14.0 版中新增。 組態可以透過兩種方式初始化:
|
PronunciationAssessmentPhonemeResult |
包含音素等級發音評估結果 注意 已在 1.14.0 版中新增。 |
PronunciationAssessmentResult |
表示發音評估結果。 注意 已在 1.14.0 版中新增。 您可以從語音辨識結果初始化結果。 |
PronunciationAssessmentWordResult |
包含字級發音評估結果 注意 已在 1.14.0 版中新增。 |
PropertyCollection |
從屬性集合擷取或設定屬性值的類別。 |
RecognitionEventArgs |
提供 RecognitionEvent 的資料。 用於內部使用的建構函式。 |
RecognitionResult |
辨識作業結果的詳細資訊。 用於內部使用的建構函式。 |
Recognizer |
不同辨識器的基類 |
ResultFuture |
非同步作業的結果。 private 建構函式 |
SessionEventArgs |
會話事件引數的基類。 用於內部使用的建構函式。 |
SourceLanguageRecognizer |
來來源語言辨識器 - 獨立語言辨識器,可用於單一語言或連續語言偵測。 注意 已在 1.18.0 版中新增。 |
SpeechConfig |
類別,定義語音/意圖辨識和語音合成的組態。 組態可以透過不同的方式初始化:
|
SpeechRecognitionCanceledEventArgs |
語音辨識已取消事件引數的類別。 用於內部使用的建構函式。 |
SpeechRecognitionEventArgs |
語音辨識事件引數的類別。 用於內部使用的建構函式。 |
SpeechRecognitionResult |
語音辨識結果的基類。 用於內部使用的建構函式。 |
SpeechRecognizer |
語音辨識器。 如果您需要指定來來源語言資訊,請只指定這三個參數之一、語言、source_language_config或auto_detect_source_language_config。 |
SpeechSynthesisBookmarkEventArgs |
語音合成書簽事件引數的類別。 注意 已在 1.16.0 版中新增。 用於內部使用的建構函式。 |
SpeechSynthesisCancellationDetails |
包含為何取消結果的詳細資訊。 |
SpeechSynthesisEventArgs |
語音合成事件引數的類別。 用於內部使用的建構函式。 |
SpeechSynthesisResult |
語音合成作業的結果。 用於內部使用的建構函式。 |
SpeechSynthesisVisemeEventArgs |
語音合成 viseme 事件引數的類別。 注意 已在 1.16.0 版中新增。 用於內部使用的建構函式。 |
SpeechSynthesisWordBoundaryEventArgs |
語音合成文字界限事件引數的類別。 注意 已在 1.21.0 版中更新。 用於內部使用的建構函式。 |
SpeechSynthesizer |
語音合成器。 |
SyllableLevelTimingResult |
包含可音調的計時結果 注意 已在 1.20.0 版中新增。 |
SynthesisVoicesResult |
包含所擷取合成語音清單的詳細資訊。 注意 已在 1.16.0 版中新增。 用於內部使用的建構函式。 |
VoiceInfo |
包含合成語音資訊的詳細資訊。 注意 已在 1.17.0 版中更新。 用於內部使用的建構函式。 |
列舉
AudioStreamContainerFormat |
定義支援的音訊資料流程容器格式。 |
AudioStreamWaveFormat |
表示 WAV 容器內指定的格式。 |
CancellationErrorCode |
定義錯誤碼,以防 CancellationReason 為 Error。 |
CancellationReason |
定義辨識結果可能會取消的可能原因。 |
NoMatchReason |
定義無法辨識辨識結果的可能原因。 |
OutputFormat |
輸出格式。 |
ProfanityOption |
移除粗話 (戴) ,或以星號取代不雅字的字母。 |
PronunciationAssessmentGradingSystem |
定義發音分數校正的點系統;預設值為 FivePoint。 |
PronunciationAssessmentGranularity |
定義發音評估資料細微性;預設值為 Phoneme。 |
PropertyId |
定義語音屬性識別碼。 |
ResultReason |
指定可能產生辨識結果的原因。 |
ServicePropertyChannel |
定義用來將屬性設定傳遞至服務的通道。 |
SpeechSynthesisOutputFormat |
定義可能的語音合成輸出音訊格式。 |
StreamStatus |
定義音訊資料流程的可能狀態。 |
SynthesisVoiceGender |
定義合成語音的性別 |
SynthesisVoiceType |
定義合成語音的類型 |