speech 套件

適用于 Python 的 Microsoft 語音 SDK

單元

audio

與處理各種辨識器音訊輸入相關的類別,以及語音合成器的音訊輸出。

dialog

與對話方塊服務連接器相關的類別。

enums

適用于 Python 的 Microsoft 語音 SDK

intent

與語音辨識意圖相關的類別。

interop

適用于 Python 的 Microsoft 語音 SDK

languageconfig

與語言組態處理相關的類別

properties

適用于 Python 的 Microsoft 語音 SDK

speech

與辨識語音中的文字、從文字合成語音,以及各種辨識器中使用的一般類別相關的類別。

transcription

與交談轉譯相關的類別。

translation

與語音翻譯至其他語言相關的類別。

version

適用于 Python 的 Microsoft 語音 SDK

類別

AudioDataStream

表示用來以資料流程方式操作音訊資料的音訊資料流程。

從語音合成結果產生音訊資料流程, (類型 SpeechSynthesisResult) 或關鍵字辨識結果 (類型 KeywordRecognitionResult) 。

AutoDetectSourceLanguageResult

表示自動偵測來來源語言結果。

您可以從語音辨識結果初始化結果。

CancellationDetails

適用于 Python 的 Microsoft 語音 SDK

Connection

用來管理所指定 Recognizer 之語音服務的連線的 Proxy 類別。

根據預設,會 Recognizer 視需要自動管理服務的連線。 類別 Connection 會提供其他方法,讓使用者明確開啟或關閉連線,以及訂閱線上狀態變更。 您可以選擇使用或不使用 Connection。 它適用于需要根據線上狀態微調應用程式行為的案例。 使用者可以選擇性地呼叫 open 以手動起始服務連線,再開始辨識 Recognizer 與此 Connection 相關聯的 。 啟動辨識之後,呼叫 openclose 可能會失敗。 這不會影響辨識器或進行中的辨識。 連線可能會因為各種原因而中斷,辨識器一律會嘗試視需要重新建立連線,以確保進行中的作業。 在所有情況下, connected/disconnected 事件都會指出線上狀態的變更。

注意

已在 1.17.0 版中更新。

用於內部使用的建構函式。

ConnectionEventArgs

提供 ConnectionEvent 的資料。

注意

已在 1.2.0 版中新增

用於內部使用的建構函式。

EventSignal

用戶端可以連線到事件訊號來接收事件,或中斷事件訊號的連線,以停止接收事件。

用於內部使用的建構函式。

KeywordRecognitionEventArgs

關鍵字辨識事件引數的類別。

用於內部使用的建構函式。

KeywordRecognitionModel

表示關鍵字辨識模型。

KeywordRecognitionResult

關鍵字辨識作業的結果。

用於內部使用的建構函式。

KeywordRecognizer

關鍵字辨識器。

NoMatchDetails

適用于 Python 的 Microsoft 語音 SDK

PhraseListGrammar

類別,允許執行時間新增片語提示來協助語音辨識。

新增至辨識器的片語會在下一次辨識開始時生效,或下次語音辨識器必須重新連線到語音服務時生效。

注意

已在 1.5.0 版中新增。

用於內部使用的建構函式。

PronunciationAssessmentConfig

代表發音評估組態

注意

已在 1.14.0 版中新增。

組態可以透過兩種方式初始化:

  • 來自參數:傳遞參考文字、分級系統、細微性、啟用誤判和案例識別碼。

  • from json:傳遞 json 字串

如需參數詳細資料,請參閱 https://docs.microsoft.com/azure/cognitive-services/speech-service/rest-speech-to-text#pronunciation-assessment-parameters

PronunciationAssessmentPhonemeResult

包含音素等級發音評估結果

注意

已在 1.14.0 版中新增。

PronunciationAssessmentResult

表示發音評估結果。

注意

已在 1.14.0 版中新增。

您可以從語音辨識結果初始化結果。

PronunciationAssessmentWordResult

包含字級發音評估結果

注意

已在 1.14.0 版中新增。

PropertyCollection

從屬性集合擷取或設定屬性值的類別。

RecognitionEventArgs

提供 RecognitionEvent 的資料。

用於內部使用的建構函式。

RecognitionResult

辨識作業結果的詳細資訊。

用於內部使用的建構函式。

Recognizer

不同辨識器的基類

ResultFuture

非同步作業的結果。

private 建構函式

SessionEventArgs

會話事件引數的基類。

用於內部使用的建構函式。

SourceLanguageRecognizer

來來源語言辨識器 - 獨立語言辨識器,可用於單一語言或連續語言偵測。

注意

已在 1.18.0 版中新增。

SpeechConfig

類別,定義語音/意圖辨識和語音合成的組態。

組態可以透過不同的方式初始化:

  • 從訂用帳戶:傳遞訂用帳戶金鑰和區域

  • 從端點:傳遞端點。 訂用帳戶金鑰或授權權杖是選擇性的。

  • 來自主機:傳遞主機位址。 訂用帳戶金鑰或授權權杖是選擇性的。

  • 從授權權杖:傳遞授權權杖和區域

SpeechRecognitionCanceledEventArgs

語音辨識已取消事件引數的類別。

用於內部使用的建構函式。

SpeechRecognitionEventArgs

語音辨識事件引數的類別。

用於內部使用的建構函式。

SpeechRecognitionResult

語音辨識結果的基類。

用於內部使用的建構函式。

SpeechRecognizer

語音辨識器。 如果您需要指定來來源語言資訊,請只指定這三個參數之一、語言、source_language_config或auto_detect_source_language_config。

SpeechSynthesisBookmarkEventArgs

語音合成書簽事件引數的類別。

注意

已在 1.16.0 版中新增。

用於內部使用的建構函式。

SpeechSynthesisCancellationDetails

包含為何取消結果的詳細資訊。

SpeechSynthesisEventArgs

語音合成事件引數的類別。

用於內部使用的建構函式。

SpeechSynthesisResult

語音合成作業的結果。

用於內部使用的建構函式。

SpeechSynthesisVisemeEventArgs

語音合成 viseme 事件引數的類別。

注意

已在 1.16.0 版中新增。

用於內部使用的建構函式。

SpeechSynthesisWordBoundaryEventArgs

語音合成文字界限事件引數的類別。

注意

已在 1.21.0 版中更新。

用於內部使用的建構函式。

SpeechSynthesizer

語音合成器。

SyllableLevelTimingResult

包含可音調的計時結果

注意

已在 1.20.0 版中新增。

SynthesisVoicesResult

包含所擷取合成語音清單的詳細資訊。

注意

已在 1.16.0 版中新增。

用於內部使用的建構函式。

VoiceInfo

包含合成語音資訊的詳細資訊。

注意

已在 1.17.0 版中更新。

用於內部使用的建構函式。

列舉

AudioStreamContainerFormat

定義支援的音訊資料流程容器格式。

AudioStreamWaveFormat

表示 WAV 容器內指定的格式。

CancellationErrorCode

定義錯誤碼,以防 CancellationReason 為 Error。

CancellationReason

定義辨識結果可能會取消的可能原因。

NoMatchReason

定義無法辨識辨識結果的可能原因。

OutputFormat

輸出格式。

ProfanityOption

移除粗話 (戴) ,或以星號取代不雅字的字母。

PronunciationAssessmentGradingSystem

定義發音分數校正的點系統;預設值為 FivePoint。

PronunciationAssessmentGranularity

定義發音評估資料細微性;預設值為 Phoneme。

PropertyId

定義語音屬性識別碼。

ResultReason

指定可能產生辨識結果的原因。

ServicePropertyChannel

定義用來將屬性設定傳遞至服務的通道。

SpeechSynthesisOutputFormat

定義可能的語音合成輸出音訊格式。

StreamStatus

定義音訊資料流程的可能狀態。

SynthesisVoiceGender

定義合成語音的性別

SynthesisVoiceType

定義合成語音的類型