microsoft-cognitiveservices-speech-sdk package

類別

ActivityReceivedEventArgs

定義已接收訊息/事件的內容。

AudioConfig

表示用來指定要使用何種輸入類型的音訊輸入組態 (,以使用麥克風、檔案、串流) 。

AudioInputStream

表示用於自訂音訊輸入組態的音訊輸入資料流程。

AudioOutputStream

表示用於自訂音訊輸出組態的音訊輸出資料流程。

AudioStreamFormat

表示用於自訂音訊輸入組態的音訊資料流程格式。

AutoDetectSourceLanguageConfig

語言自動偵測組態。

AutoDetectSourceLanguageResult

輸出格式

BaseAudioPlayer

基底音訊播放程式類別 TODO:目前僅播放 PCM。

BotFrameworkConfig

類別,定義使用 Bot Framework 後端之對話方塊服務連接器物件的組態。

CancellationDetails

包含為何取消結果的詳細資訊。

CancellationDetailsBase

包含為何取消結果的詳細資訊。

Connection

Connection 是一種 Proxy 類別,可用來管理與指定辨識器之語音服務的連線。 根據預設,辨識器會視需要自發管理服務的連線。 Connection 類別提供其他方法,讓使用者明確開啟或關閉連線,以及訂閱線上狀態變更。 使用 Connection 是選擇性的,主要適用于需要根據線上狀態微調應用程式行為的案例。 使用者可以選擇性地呼叫 Open () ,以在與此連線相關聯的辨識器上開始辨識之前,事先手動設定連線。 如果辨識器需要連線或中斷服務連線,則會獨立設定或關閉連線。 在此情況下,連線會透過連線/中斷線上活動變更來通知線上狀態。 已在 1.2.1 版中新增。

ConnectionEventArgs

定義線上活動的承載,例如連線/已中斷連線。 已在 1.2.0 版中新增

ConnectionMessage

ConnectionMessage 代表從語音服務傳送和接收的實作特定訊息。 這些訊息僅供偵錯之用,不應用於 Azure 認知服務語音服務的生產使用案例。 從語音服務傳送和接收的訊息可能會變更,而不需通知。 這包括訊息內容、標頭、承載、排序等。已在 1.11.0 版中新增。

ConnectionMessageEventArgs
Conversation
ConversationExpirationEventArgs

定義會話事件的內容,例如 SessionStarted/Stopped、SoundStarted/Stopped。

ConversationParticipantsChangedEventArgs

定義會話事件的內容,例如 SessionStarted/Stopped、SoundStarted/Stopped。

ConversationTranscriber
ConversationTranscriptionCanceledEventArgs

定義 RecognitionErrorEvent 的內容。

ConversationTranscriptionEventArgs

定義交談轉譯/轉譯事件的內容。

ConversationTranslationCanceledEventArgs
ConversationTranslationEventArgs

定義會話事件的承載,例如偵測到語音開始/結束

ConversationTranslationResult

翻譯文字結果。

ConversationTranslator

加入、離開或連線到交談。

CustomCommandsConfig

類別,定義使用 CustomCommands 後端之對話方塊服務連接器物件的組態。

Diagnostics

定義在 1.21.0 版中新增的主控台輸出診斷 API

DialogServiceConfig

定義對話方塊服務連接器基底組態的類別

DialogServiceConnector

對話方塊服務連接器

IntentRecognitionCanceledEventArgs

定義意圖辨識已取消結果事件的承載。

IntentRecognitionEventArgs

意圖辨識結果事件引數。

IntentRecognitionResult

意圖辨識結果。

IntentRecognizer

意圖辨識器。

KeywordRecognitionModel

表示使用者說出關鍵字以起始進一步語音辨識的關鍵字辨識模型。

LanguageUnderstandingModel

語言理解模型

NoMatchDetails

包含 NoMatch 辨識結果的詳細資訊。

Participant

代表交談中的參與者。 已在 1.4.0 版中新增

PhraseListGrammar

允許新增片語來改善語音辨識。

新增至辨識器的片語會在下一次辨識開始時生效,或下次 SpeechSDK 必須重新連線到語音服務時生效。

PronunciationAssessmentConfig

發音評定組態。

PronunciationAssessmentResult

發音評估結果。

PropertyCollection

表示屬性及其值的集合。

PullAudioInputStream

表示用於自訂音訊輸入組態的音訊輸入資料流程。

PullAudioInputStreamCallback

抽象基類,定義自訂音訊輸入資料流程的回呼方法 (讀取 () 和 close () ) ) 。

PullAudioOutputStream

表示用於自訂音訊輸出組態的記憶體支援推播音訊輸出資料流程。

PushAudioInputStream

表示用於自訂音訊輸入組態的記憶體支援推播音訊輸入資料流程。

PushAudioOutputStream

表示用於自訂音訊輸出組態的音訊輸出資料流程。

PushAudioOutputStreamCallback

抽象基類,定義自訂音訊輸出資料流程的回呼方法 (寫入 () 和 close () ) ) 。

RecognitionEventArgs

定義會話事件的承載,例如偵測到語音開始/結束

RecognitionResult

定義語音辨識的結果。

Recognizer

定義基類辨識器,主要包含常見的事件處理常式。

ServiceEventArgs

定義 1.9.0 版中新增之任何服務訊息事件的承載

SessionEventArgs

定義會話事件的內容,例如 SessionStarted/Stopped、SoundStarted/Stopped。

SourceLanguageConfig

來來源語言組態。

SpeakerAudioDestination

代表喇叭播放音訊目的地,其僅適用于瀏覽器。 注意:SDK 會嘗試使用 媒體來源延伸模組 來播放音訊。 Mp3 格式在 Microsoft Edge、Chrome 和 Safari (桌面) 上具有更好的支援,因此最好指定 mp3 格式以供播放。

SpeakerIdentificationModel

定義說話者辨識模型的 SpeakerIdentificationModel 類別包含一組設定檔,用來識別說話者 ()

SpeakerRecognitionCancellationDetails
SpeakerRecognitionResult

輸出格式

SpeakerRecognizer

針對語音設定檔作業的使用者定義 SpeakerRecognizer 類別 (例如 createProfile、deleteProfile)

SpeakerVerificationModel

定義說話者辨識模型的 SpeakerVerificationModel 類別包含要驗證說話者的設定檔

SpeechConfig

語音設定。

SpeechConfigImpl
SpeechRecognitionCanceledEventArgs
SpeechRecognitionEventArgs

定義語音辨識/辨識事件的內容。

SpeechRecognitionResult

定義語音辨識的結果。

SpeechRecognizer

從麥克風、檔案或其他音訊輸入資料流程執行語音辨識,並取得轉譯的文字。

SpeechSynthesisBookmarkEventArgs

定義語音合成書簽事件的內容。

SpeechSynthesisEventArgs

定義語音合成事件的內容。

SpeechSynthesisResult

定義語音合成的結果。

SpeechSynthesisVisemeEventArgs

定義語音合成 viseme 事件的內容。

SpeechSynthesisWordBoundaryEventArgs

定義語音合成文字界限事件的內容。

SpeechSynthesizer

定義語音轉換文字的 SpeechSynthesizer 類別。 已在 1.16.0 版中更新

SpeechTranslationConfig

語音翻譯設定。

SynthesisResult

合成結果的基類

SynthesisVoicesResult

定義語音合成的結果。

TranslationRecognitionCanceledEventArgs

定義語音辨識已取消結果事件的承載。

TranslationRecognitionEventArgs

翻譯文字結果事件引數。

TranslationRecognitionResult

翻譯文字結果。

TranslationRecognizer

翻譯辨識器

TranslationSynthesisEventArgs

翻譯合成事件引數

TranslationSynthesisResult

定義翻譯合成結果,也就是目的語言中翻譯文字的語音輸出。

Translations

表示參數及其值的集合。

TurnStatusReceivedEventArgs

定義已接收訊息/事件的內容。

User
VoiceInfo

1.20.0 版中新增的語音合成語音相關資訊。

VoiceProfile

定義說話者辨識的語音設定檔類別

VoiceProfileCancellationDetails
VoiceProfileClient

針對語音設定檔作業 (的使用者定義 VoiceProfileClient 類別,例如 createProfile、deleteProfile)

VoiceProfileEnrollmentCancellationDetails
VoiceProfileEnrollmentResult

輸出格式

VoiceProfilePhraseResult

輸出格式

VoiceProfileResult

輸出格式

介面

CancellationEventArgs
ConversationInfo
IParticipant

代表交談中的參與者。 已在 1.4.0 版中新增

IPlayer

表示用來控制音訊播放的音訊播放介面,例如暫停、繼續等。

VoiceSignature

列舉

AudioFormatTag
CancellationErrorCode

定義錯誤碼,以防 CancellationReason 為 Error。 已在 1.1.0 版中新增。

CancellationReason

定義辨識結果可能會取消的可能原因。

LanguageIdMode

語言識別模式

LogLevel
NoMatchReason

定義無法辨識辨識結果的可能原因。

OutputFormat

定義語音辨識器輸出格式。

ParticipantChangedReason
ProfanityOption

不雅內容選項。 已在 1.7.0 版中新增。

PronunciationAssessmentGradingSystem

定義發音分數校正的點系統;預設值為 FivePoint。 已在 1.15.0 版中新增

PronunciationAssessmentGranularity

定義發音評估資料細微性;預設值為 Phoneme。 已在 1.15.0 版中新增

PropertyId

定義語音屬性識別碼。

ResultReason

定義可能會產生辨識結果的可能原因。

ServicePropertyChannel

定義用來將屬性設定傳遞至服務的通道。 已在 1.7.0 版中新增。

SpeakerRecognitionResultType
SpeechSynthesisBoundaryType

定義語音合成界限事件的界限類型。

SpeechSynthesisOutputFormat

定義語音合成音訊輸出格式。 SpeechSynthesisOutputFormat 1.17.0 版已更新

VoiceProfileType

輸出格式