SpeechRecognizer class

リファレンス

パッケージ:: microsoft-cognitiveservices-speech-sdk

マイク、ファイル、またはその他のオーディオ入力ストリームから音声認識を実行し、結果として文字起こしされたテキストを取得します。

Extends: Recognizer

コンストラクター

SpeechRecognizer(SpeechConfig, AudioConfig)

SpeechRecognizer コンストラクター。

プロパティ

authorizationToken	サービスとの通信に使用される承認トークンを取得します。
canceled	イベントが取り消されると、認識中にエラーが発生したことが通知されます。
endpointId	音声認識に使用されるカスタマイズされた音声モデルのエンドポイント ID を取得します。
internalData
outputFormat	認識の出力形式を取得します。
properties	この SpeechRecognizer に対して定義されているプロパティとその値のコレクション。
recognized	イベント認識は、最終的な認識結果が受信されたことを通知します。
recognizing	中間認識結果が受信されたことを通知するイベント。
speechRecognitionLanguage	認識の音声言語を取得します。
telemetryEnabled	このメソッドは、テレメトリ設定の現在の状態を返します。

継承されたプロパティ

sessionStarted	セッション開始イベントのイベントハンドラーを定義します。
sessionStopped	セッション停止イベントのイベントハンドラーを定義します。
speechEndDetected	音声停止イベントのイベントハンドラーを定義します。
speechStartDetected	音声開始イベントのイベントハンドラーを定義します。

メソッド

close(() => void, (error: string) => void)	は、このクラスのインスタンスによって保持されているすべての外部リソースを閉じます。
dispose(boolean)	オブジェクトによって保持されているリソースを破棄します。
FromConfig(SpeechConfig, AutoDetectSourceLanguageConfig, AudioConfig)	SpeechRecognizer コンストラクター。
recognizeOnceAsync((e: SpeechRecognitionResult) => void, (e: string) => void)	音声認識を開始し、最初の発話が認識された後に停止します。タスクは、結果として認識テキストを返します。注: RecognizeOnceAsync() は、最初の発話が認識されたときに返されるため、コマンドやクエリなどの単一ショット認識にのみ適しています。実行時間の長い認識の場合は、代わりに StartContinuousRecognitionAsync() を使用します。
startContinuousRecognitionAsync(() => void, (e: string) => void)	stopContinuousRecognitionAsync() が呼び出されるまで音声認識を開始します。ユーザーは、認識結果を受信するためにイベントをサブスクライブする必要があります。
startKeywordRecognitionAsync(KeywordRecognitionModel, () => void, (e: string) => void)	stopKeywordRecognitionAsync() が呼び出されるまで、キーワードスポッティングを使用して音声認識を開始します。ユーザーは、認識結果を受信するためにイベントをサブスクライブする必要があります。注: キーワードスポッティング機能は、Speech Devices SDK でのみ使用できます。この機能は現在、SDK 自体には含まれていません。
stopContinuousRecognitionAsync(() => void, (e: string) => void)	継続的な音声認識を停止します。
stopKeywordRecognitionAsync(() => void)	継続的な音声認識を停止します。注: キーワードスポッティング機能は、Speech Devices SDK でのみ使用できます。この機能は現在、SDK 自体には含まれていません。

継承されたメソッド

enableTelemetry(boolean)

このメソッドは、テレメトリをグローバルに有効または無効にします。

コンストラクターの詳細

SpeechRecognizer(SpeechConfig, AudioConfig)

SpeechRecognizer コンストラクター。

new SpeechRecognizer(speechConfig: SpeechConfig, audioConfig?: AudioConfig)

パラメーター

speechConfig: SpeechConfig

この認識エンジンの初期プロパティのセット

audioConfig: AudioConfig

認識エンジンに関連付けられているオプションのオーディオ構成

プロパティの詳細

authorizationToken

サービスとの通信に使用される承認トークンを取得します。

string authorizationToken

プロパティ値

string

承認トークン。

canceled

イベントが取り消されると、認識中にエラーが発生したことが通知されます。

public canceled: (sender: Recognizer, event: SpeechRecognitionCanceledEventArgs) => void

プロパティ値

(sender: Recognizer, event: SpeechRecognitionCanceledEventArgs) => void

endpointId

音声認識に使用されるカスタマイズされた音声モデルのエンドポイント ID を取得します。

string endpointId

プロパティ値

string

音声認識に使用されるカスタマイズされた音声モデルのエンドポイント ID。

internalData

object internalData

プロパティ値

object

outputFormat

認識の出力形式を取得します。

OutputFormat outputFormat

プロパティ値

OutputFormat

認識の出力形式。

properties

この SpeechRecognizer に対して定義されているプロパティとその値のコレクション。

PropertyCollection properties

プロパティ値

PropertyCollection

この SpeechRecognizer に対して定義されているプロパティとその値のコレクション。

recognized

イベント認識は、最終的な認識結果が受信されたことを通知します。

public recognized: (sender: Recognizer, event: SpeechRecognitionEventArgs) => void

プロパティ値

(sender: Recognizer, event: SpeechRecognitionEventArgs) => void

recognizing

中間認識結果が受信されたことを通知するイベント。

public recognizing: (sender: Recognizer, event: SpeechRecognitionEventArgs) => void

プロパティ値

(sender: Recognizer, event: SpeechRecognitionEventArgs) => void

speechRecognitionLanguage

認識の音声言語を取得します。

string speechRecognitionLanguage

プロパティ値

string

認識の音声言語。

telemetryEnabled

このメソッドは、テレメトリ設定の現在の状態を返します。

static boolean telemetryEnabled

プロパティ値

boolean

テレメトリが有効な場合は true、それ以外の場合は false。

継承されたプロパティの詳細

sessionStarted

セッション開始イベントのイベントハンドラーを定義します。

public sessionStarted: (sender: Recognizer, event: SessionEventArgs) => void

プロパティ値

(sender: Recognizer, event: SessionEventArgs) => void

Inherited FromRecognizer.sessionStarted

sessionStopped

セッション停止イベントのイベントハンドラーを定義します。

public sessionStopped: (sender: Recognizer, event: SessionEventArgs) => void

プロパティ値

(sender: Recognizer, event: SessionEventArgs) => void

Inherited FromRecognizer.sessionStopped

speechEndDetected

音声停止イベントのイベントハンドラーを定義します。

public speechEndDetected: (sender: Recognizer, event: RecognitionEventArgs) => void

プロパティ値

(sender: Recognizer, event: RecognitionEventArgs) => void

Inherited FromRecognizer.speechEndDetected

speechStartDetected

音声開始イベントのイベントハンドラーを定義します。

public speechStartDetected: (sender: Recognizer, event: RecognitionEventArgs) => void

プロパティ値

(sender: Recognizer, event: RecognitionEventArgs) => void

Recognizer.speechStartDetected から継承された

メソッドの詳細

close(() => void, (error: string) => void)

は、このクラスのインスタンスによって保持されているすべての外部リソースを閉じます。

function close(cb?: () => void, errorCb?: (error: string) => void)

パラメーター

cb: () => void

errorCb: (error: string) => void

dispose(boolean)

オブジェクトによって保持されているリソースを破棄します。

function dispose(disposing: boolean): Promise<void>

パラメーター

disposing: boolean

オブジェクトを破棄する場合は true。

戻り値

Promise<void>

FromConfig(SpeechConfig, AutoDetectSourceLanguageConfig, AudioConfig)

SpeechRecognizer コンストラクター。

static function FromConfig(speechConfig: SpeechConfig, autoDetectSourceLanguageConfig: AutoDetectSourceLanguageConfig, audioConfig?: AudioConfig): SpeechRecognizer

パラメーター

speechConfig: SpeechConfig

この認識エンジンの初期プロパティのセット

autoDetectSourceLanguageConfig: AutoDetectSourceLanguageConfig

認識エンジンに関連付けられているソース言語検出の構成

audioConfig: AudioConfig

認識エンジンに関連付けられているオプションのオーディオ構成

戻り値

SpeechRecognizer

recognizeOnceAsync((e: SpeechRecognitionResult) => void, (e: string) => void)

音声認識を開始し、最初の発話が認識された後に停止します。タスクは、結果として認識テキストを返します。注: RecognizeOnceAsync() は、最初の発話が認識されたときに返されるため、コマンドやクエリなどの単一ショット認識にのみ適しています。実行時間の長い認識の場合は、代わりに StartContinuousRecognitionAsync() を使用します。

function recognizeOnceAsync(cb?: (e: SpeechRecognitionResult) => void, err?: (e: string) => void)

パラメーター

cb: (e: SpeechRecognitionResult) => void

SpeechRecognitionResult を受け取ったコールバック。

err: (e: string) => void

エラーが発生した場合に呼び出されるコールバック。

startContinuousRecognitionAsync(() => void, (e: string) => void)

stopContinuousRecognitionAsync() が呼び出されるまで音声認識を開始します。ユーザーは、認識結果を受信するためにイベントをサブスクライブする必要があります。

function startContinuousRecognitionAsync(cb?: () => void, err?: (e: string) => void)

パラメーター

cb: () => void

認識が開始されると呼び出されるコールバック。

err: (e: string) => void

エラーが発生した場合に呼び出されるコールバック。

startKeywordRecognitionAsync(KeywordRecognitionModel, () => void, (e: string) => void)

stopKeywordRecognitionAsync() が呼び出されるまで、キーワードスポッティングを使用して音声認識を開始します。ユーザーは、認識結果を受信するためにイベントをサブスクライブする必要があります。注: キーワードスポッティング機能は、Speech Devices SDK でのみ使用できます。この機能は現在、SDK 自体には含まれていません。

function startKeywordRecognitionAsync(model: KeywordRecognitionModel, cb?: () => void, err?: (e: string) => void)

パラメーター

model: KeywordRecognitionModel

認識するキーワードを指定するキーワード認識モデル。

cb: () => void

認識が開始されると呼び出されるコールバック。

err: (e: string) => void

エラーが発生した場合に呼び出されるコールバック。

stopContinuousRecognitionAsync(() => void, (e: string) => void)

継続的な音声認識を停止します。

function stopContinuousRecognitionAsync(cb?: () => void, err?: (e: string) => void)

パラメーター

cb: () => void

認識が停止した後に呼び出されるコールバック。

err: (e: string) => void

エラーが発生した場合に呼び出されるコールバック。

stopKeywordRecognitionAsync(() => void)

継続的な音声認識を停止します。注: キーワードスポッティング機能は、Speech Devices SDK でのみ使用できます。この機能は現在、SDK 自体には含まれていません。

function stopKeywordRecognitionAsync(cb?: () => void)

パラメーター

cb: () => void

認識が停止した後に呼び出されるコールバック。

継承済みメソッドの詳細

enableTelemetry(boolean)

このメソッドは、テレメトリをグローバルに有効または無効にします。

static function enableTelemetry(enabled: boolean)

パラメーター

enabled: boolean

テレメトリ収集のグローバル設定。 true に設定すると、マイクエラー、認識エラーなどのテレメトリ情報が収集され、Microsoft に送信されます。 false に設定すると、テレメトリは Microsoft に送信されません。

Inherited FromRecognizer.enableTelemetry

次の方法で共有

SpeechRecognizer class

コンストラクター

プロパティ

継承されたプロパティ

メソッド

継承されたメソッド

コンストラクターの詳細

SpeechRecognizer(SpeechConfig, AudioConfig)

パラメーター

プロパティの詳細

authorizationToken

プロパティ値

canceled

プロパティ値

endpointId

プロパティ値

internalData

プロパティ値

outputFormat

プロパティ値

properties

プロパティ値

recognized

プロパティ値

recognizing

プロパティ値

speechRecognitionLanguage

プロパティ値

telemetryEnabled

プロパティ値

継承されたプロパティの詳細

sessionStarted

プロパティ値

sessionStopped

プロパティ値

speechEndDetected

プロパティ値

speechStartDetected

プロパティ値

メソッドの詳細

close(() => void, (error: string) => void)

パラメーター

dispose(boolean)

パラメーター

戻り値

FromConfig(SpeechConfig, AutoDetectSourceLanguageConfig, AudioConfig)

パラメーター

戻り値

recognizeOnceAsync((e: SpeechRecognitionResult) => void, (e: string) => void)

パラメーター

startContinuousRecognitionAsync(() => void, (e: string) => void)

パラメーター

startKeywordRecognitionAsync(KeywordRecognitionModel, () => void, (e: string) => void)

パラメーター

stopContinuousRecognitionAsync(() => void, (e: string) => void)

パラメーター

stopKeywordRecognitionAsync(() => void)

パラメーター

継承済みメソッドの詳細

enableTelemetry(boolean)

パラメーター