microsoft-cognitiveservices-speech-sdk package

參考

類別

ActivityReceivedEventArgs	定義已接收訊息/事件的內容。
AudioConfig	表示用來指定要使用何種輸入類型的音訊輸入組態， (麥克風、檔案、資料流程) 。
AudioInputStream	表示用於自訂音訊輸入組態的音訊輸入資料流程。
AudioOutputStream	表示用於自訂音訊輸出組態的音訊輸出資料流程。
AudioStreamFormat	表示用於自訂音訊輸入組態的音訊資料流程格式。
AutoDetectSourceLanguageConfig	語言自動偵測組態。
AutoDetectSourceLanguageResult	輸出格式
AvatarConfig	定義交談虛擬人偶組態。
AvatarEventArgs	定義交談虛擬人偶事件的內容。
AvatarSynthesizer	定義虛擬人偶合成器。
AvatarVideoFormat	定義虛擬人偶輸出視訊格式。
AvatarWebRTCConnectionResult	定義虛擬人偶 WebRTC 連線結果。
BaseAudioPlayer	基底音訊播放程式類別 TODO：目前僅播放 PCM。
BotFrameworkConfig	類別，定義使用 Bot Framework 後端之對話方塊服務連接器物件的組態。
CancellationDetails	包含取消結果原因的詳細資訊。
CancellationDetailsBase	包含取消結果原因的詳細資訊。
Connection	Connection 是一種 Proxy 類別，可用來管理與指定辨識器之語音服務的連線。根據預設，辨識器會在需要時自動管理服務的連線。 Connection 類別會提供其他方法，讓使用者明確開啟或關閉連線，以及訂閱線上狀態變更。使用 Connection 是選擇性的，主要是針對需要根據線上狀態微調應用程式行為的案例。使用者可以選擇性地呼叫 Open () ，在開始辨識與此連線相關聯的辨識器之前，事先手動設定連線。如果辨識器需要連線或中斷連線至服務，則會獨立設定或關閉連線。在此情況下，連線會透過連線/已中斷線上活動變更來收到通知。已在 1.2.1 版中新增。
ConnectionEventArgs	定義線上活動的承載，例如 Connected/Disconnected。已在 1.2.0 版中新增
ConnectionMessage	ConnectionMessage 代表傳送至語音服務及從語音服務接收的實作特定訊息。這些訊息是為了偵錯而提供，不應用於 Azure 認知服務語音服務的生產使用案例。傳送至語音服務及從語音服務接收的訊息可能會變更，而不需通知。這包括訊息內容、標頭、承載、排序等。已在 1.11.0 版中新增。
ConnectionMessageEventArgs
Conversation
ConversationExpirationEventArgs	定義會話事件的內容，例如 SessionStarted/Stopped、SoundStarted/Stopped。
ConversationParticipantsChangedEventArgs	定義會話事件的內容，例如 SessionStarted/Stopped、SoundStarted/Stopped。
ConversationTranscriber	使用麥克風、檔案或其他音訊輸入串流的說話者分隔來執行語音辨識，並取得轉譯的文字。
ConversationTranscriptionCanceledEventArgs	定義 RecognitionErrorEvent 的內容。
ConversationTranscriptionEventArgs	定義交談轉譯/轉譯事件的內容。
ConversationTranscriptionResult	定義交談轉譯的結果。
ConversationTranslationCanceledEventArgs
ConversationTranslationEventArgs	定義會話事件的承載，例如偵測到語音開始/結束
ConversationTranslationResult	翻譯文字結果。
ConversationTranslator	加入、離開或連線至交談。
Coordinate	定義 2D 空間中的座標。
CustomCommandsConfig	類別，定義使用 CustomCommands 後端之對話方塊服務連接器物件的組態。
Diagnostics	定義診斷 API 以管理 1.21.0 版中新增的主控台輸出
DialogServiceConfig	定義對話服務連接器基底組態的類別
DialogServiceConnector	對話方塊服務連接器
IntentRecognitionCanceledEventArgs	定義意圖辨識已取消結果事件的承載。
IntentRecognitionEventArgs	意圖辨識結果事件引數。
IntentRecognitionResult	意圖辨識結果。
IntentRecognizer	意圖辨識器。
KeywordRecognitionModel	表示當使用者說出關鍵字來起始進一步語音辨識時，用於辨識的關鍵字辨識模型。
LanguageUnderstandingModel	語言理解模型
Meeting
MeetingTranscriber
MeetingTranscriptionCanceledEventArgs	定義 MeetingTranscriptionCanceledEvent 的內容。
MeetingTranscriptionEventArgs	定義會議轉譯/轉譯事件的內容。
NoMatchDetails	包含 NoMatch 辨識結果的詳細資訊。
Participant	代表交談中的參與者。已在 1.4.0 版中新增
PhraseListGrammar	允許新增片語以改善語音辨識。新增至辨識器的片語在下一次辨識開始時有效，或下次 SpeechSDK 必須重新連線到語音服務時有效。
PronunciationAssessmentConfig	發音評定組態。
PronunciationAssessmentResult	發音評定結果。
PropertyCollection	表示屬性及其值的集合。
PullAudioInputStream	表示用於自訂音訊輸入組態的音訊輸入資料流程。
PullAudioInputStreamCallback	抽象基類，定義自訂音訊輸入資料流程) (read () 和 close () ) 的回呼方法。
PullAudioOutputStream	表示用於自訂音訊輸出組態的記憶體支援推播音訊輸出資料流程。
PushAudioInputStream	表示用於自訂音訊輸入組態的記憶體支援推播音訊輸入資料流程。
PushAudioOutputStream	表示用於自訂音訊輸出組態的音訊輸出資料流程。
PushAudioOutputStreamCallback	抽象基類，定義自訂音訊輸出資料流程) (寫入 () 和 close () ) 的回呼方法。
RecognitionEventArgs	定義會話事件的承載，例如偵測到語音開始/結束
RecognitionResult	定義語音辨識的結果。
Recognizer	定義基類辨識器，主要包含常見的事件處理常式。
ServiceEventArgs	定義 1.9.0 版中新增的任何服務訊息事件的承載
SessionEventArgs	定義會話事件的內容，例如 SessionStarted/Stopped、SoundStarted/Stopped。
SourceLanguageConfig	來來源語言組態。
SpeakerAudioDestination	代表喇叭播放音訊目的地，其僅適用于瀏覽器。注意：SDK 會嘗試使用媒體來源延伸模組播放音訊。 Mp3 格式在 Microsoft Edge、Chrome 和 Safari (桌面) 上具有更好的支援，因此最好指定 mp3 格式來播放。
SpeakerIdentificationModel	定義說話者辨識模型的 SpeakerIdentificationModel 類別包含一組設定檔，用來識別說話者 ()
SpeakerRecognitionCancellationDetails
SpeakerRecognitionResult	輸出格式
SpeakerRecognizer	針對語音設定檔作業 (的使用者定義 SpeakerRecognizer 類別，例如 createProfile、deleteProfile)
SpeakerVerificationModel	定義說話者辨識模型的 SpeakerVerificationModel 類別包含用來驗證說話者的設定檔
SpeechConfig	語音設定。
SpeechConfigImpl
SpeechRecognitionCanceledEventArgs
SpeechRecognitionEventArgs	定義語音辨識/辨識事件的內容。
SpeechRecognitionResult	定義語音辨識的結果。
SpeechRecognizer	從麥克風、檔案或其他音訊輸入資料流程執行語音辨識，並取得轉譯的文字。
SpeechSynthesisBookmarkEventArgs	定義語音合成書簽事件的內容。
SpeechSynthesisEventArgs	定義語音合成事件的內容。
SpeechSynthesisResult	定義語音合成的結果。
SpeechSynthesisVisemeEventArgs	定義語音合成 viseme 事件的內容。
SpeechSynthesisWordBoundaryEventArgs	定義語音合成文字界限事件的內容。
SpeechSynthesizer	定義語音轉換文字的 SpeechSynthesizer 類別。 1.16.0 版已更新
SpeechTranslationConfig	語音翻譯組態。
SynthesisResult	合成結果的基類
SynthesisVoicesResult	定義語音合成的結果。
Synthesizer
TranslationRecognitionCanceledEventArgs	定義語音辨識已取消結果事件的承載。
TranslationRecognitionEventArgs	翻譯文字結果事件引數。
TranslationRecognitionResult	翻譯文字結果。
TranslationRecognizer	翻譯辨識器
TranslationSynthesisEventArgs	翻譯合成事件引數
TranslationSynthesisResult	定義翻譯合成結果，也就是目的語言中翻譯文字的語音輸出。
Translations	表示參數及其值的集合。
TurnStatusReceivedEventArgs	定義已接收訊息/事件的內容。
User
VoiceInfo	在 1.20.0 版中新增的語音合成語音相關資訊。
VoiceProfile	定義說話者辨識的語音設定檔類別
VoiceProfileCancellationDetails
VoiceProfileClient	針對語音設定檔作業的使用者定義 VoiceProfileClient 類別 (，例如 createProfile、deleteProfile)
VoiceProfileEnrollmentCancellationDetails
VoiceProfileEnrollmentResult	輸出格式
VoiceProfilePhraseResult	輸出格式
VoiceProfileResult	輸出格式

介面

CancellationEventArgs
ConversationInfo
IParticipant	代表交談中的參與者。已在 1.4.0 版中新增
IPlayer	表示用來控制音訊播放的音訊播放程式介面，例如暫停、繼續等等。
IVoiceJson
MeetingInfo
VoiceSignature

列舉

AudioFormatTag
CancellationErrorCode	定義當 CancellationReason 為 Error 時的錯誤碼。已在 1.1.0 版中新增。
CancellationReason	定義可能取消辨識結果的可能原因。
LanguageIdMode	語言識別模式
LogLevel
NoMatchReason	定義無法辨識辨識結果的可能原因。
OutputFormat	定義語音辨識器輸出格式。
ParticipantChangedReason
ProfanityOption	粗話選項。已在 1.7.0 版中新增。
PronunciationAssessmentGradingSystem	定義發音分數校正的點系統;預設值為 FivePoint。已在 1.15.0 版中新增
PronunciationAssessmentGranularity	定義發音評估資料細微性;預設值為 Phoneme。已在 1.15.0 版中新增
PropertyId	定義語音屬性識別碼。
ResultReason	定義可能產生辨識結果的可能原因。
ServicePropertyChannel	定義用來將屬性設定傳遞至服務的通道。已在 1.7.0 版中新增。
SpeakerRecognitionResultType
SpeechSynthesisBoundaryType	定義語音合成界限事件的界限類型。
SpeechSynthesisOutputFormat	定義語音合成音訊輸出格式。 SpeechSynthesisOutputFormat 1.17.0 版已更新
VoiceProfileType	輸出格式

共用方式為

microsoft-cognitiveservices-speech-sdk package

類別

介面

列舉

其他資源