com.microsoft.cognitiveservices.speech

クラス

AudioDataStream

オーディオ データをストリームとして操作するために使用されるオーディオ データ ストリームを表します。

AutoDetectSourceLanguageConfig

可能なソース言語候補の指定に使用されるソース言語の自動検出構成を表します。オブジェクトが保持する基になるリソースを解放するには、close() を呼び出す必要があります。

AutoDetectSourceLanguageResult

バージョン 1.8.0 で追加されたソース言語を自動検出した結果を表します

CancellationDetails

結果が取り消された理由に関する詳細情報が含まれます。

ClassLanguageModel

クラス言語モデルを表します。

Connection

接続は、指定した Recognizer の音声サービスへの接続を管理するためのプロキシ クラスです。

ConnectionEventArgs

接続/切断などの接続イベントのペイロードを定義します。

ConnectionMessage

接続メッセージは、音声サービスとの間で送受信される実装固有のメッセージを表します。

ConnectionMessageEventArgs

接続のメッセージ受信イベントのペイロードを定義します。

Diagnostics

ネイティブ ログとその他の診断

EmbeddedSpeechConfig

埋め込み (オフライン) 音声構成を定義するクラス。

Grammar

音声のレコニトン精度の向上に役立つ一般的な文法を表します。

GrammarList

音声認識の精度を向上させるために、SpeechRecognizer に複数の文法を追加できるようにします。

HybridSpeechConfig

音声認識と音声合成のためのハイブリッド (クラウドと埋め込み) 構成を定義するクラス。

KeywordRecognitionEventArgs

認識/認識されるイベントキーワード (keyword)のコンテンツを定義します。

KeywordRecognitionModel

ユーザーが音声認識を開始するキーワード (keyword)を言ったときに認識するためのキーワード (keyword)認識モデルを表します。

KeywordRecognitionResult

キーワード (keyword)認識の結果を定義します。

KeywordRecognizer

音声入力キーワード (keyword)認識を実行します。

NoMatchDetails

一致しない認識結果の詳細情報が含まれます。

PhraseListGrammar

音声認識を向上させるために新しいフレーズを追加できます。

PronunciationAssessmentConfig

発音評価の構成を表します。

PronunciationAssessmentResult

発音評価の結果を表します。

PropertyCollection

プロパティとその値のコレクションを表します。

RecognitionEventArgs

Speech Start/End Detected などの認識イベントのペイロードを定義します

RecognitionResult

認識操作の結果に関する詳細情報が含まれます。

Recognizer

主に共通のイベント ハンドラーを含む基本クラス Recognizer を定義します。

SessionEventArgs

セッション開始/停止イベントのペイロードを定義します。

SourceLanguageConfig

認識ソース言語の指定に使用されるソース言語の構成を表します。

SpeechConfig

音声の構成。

SpeechRecognitionCanceledEventArgs

音声認識で取り消されたイベントのペイロードを定義します。

SpeechRecognitionEventArgs

音声認識/認識イベントの内容を定義します。

SpeechRecognitionModel

音声認識モデルの詳細な情報が含まれます。

SpeechRecognitionResult

音声認識の結果を定義します。

SpeechRecognizer

マイク、ファイル、またはその他のオーディオ入力ストリームから音声認識を実行し、結果として文字起こしされたテキストを取得します。

SpeechSynthesisBookmarkEventArgs

音声合成ブックマーク イベントの内容を定義します。

SpeechSynthesisCancellationDetails

音声合成が取り消された理由に関する詳細情報が含まれます。

SpeechSynthesisEventArgs

音声合成関連のイベントの内容を定義します。

SpeechSynthesisResult

音声合成操作の結果に関する詳細情報が含まれます。

SpeechSynthesisVisemeEventArgs

音声合成口形素イベントの内容を定義します。

SpeechSynthesisWordBoundaryEventArgs

音声合成ワード境界イベントの内容を定義します。

SpeechSynthesizer

スピーカー、ファイル、またはその他のオーディオ出力ストリームに対して音声合成を実行し、結果として合成されたオーディオを取得します。

SpeechTranslationModel

音声翻訳モデルの詳細な情報が含まれます。

SynthesisVoicesResult

取得した合成音声リストに関する詳細情報が含まれます。

VoiceInfo

合成音声情報に関する詳細情報が含まれます。

列挙型

CancellationErrorCode

キャンセル理由が Error である場合のエラー コードを定義します。

CancellationReason

認識結果が取り消される可能性がある理由を定義します。

NoMatchReason

認識結果が認識されない可能性がある理由を定義します。

OutputFormat

Speech Recognizer の出力形式を定義します。

ProfanityOption

応答結果の不適切な表現オプションを定義します。

PronunciationAssessmentGradingSystem

発音スコア調整のポイント システムを定義します。既定値は 5ポイントです。

PronunciationAssessmentGranularity

発音評価の粒度を定義します。既定値は Phoneme です。

PropertyId

プロパティ ID を定義します。

ResultReason

認識結果が生成される可能性がある理由を定義します。

ServicePropertyChannel

サービス プロパティの送信に使用するチャネルを定義します。

SpeechSynthesisBoundaryType

音声合成境界イベントの境界の種類を定義します。

SpeechSynthesisOutputFormat

可能な音声合成出力オーディオ形式を定義します。

StreamStatus

オーディオ データ ストリームの使用可能な状態を定義します。

SynthesisVoiceGender

合成音声の性別を定義します。

SynthesisVoiceType

合成音声の種類を定義します。