SpeechRecognizer クラス

定義

音声をテキストに文字起こしします。 音声は、マイク、オーディオ ファイル、またはその他のオーディオ入力ストリームを介して受信できます。

public sealed class SpeechRecognizer : Microsoft.CognitiveServices.Speech.Recognizer
type SpeechRecognizer = class
    inherit Recognizer
Public NotInheritable Class SpeechRecognizer
Inherits Recognizer
継承
SpeechRecognizer

この例では、マイクから音声認識エンジンを使用し、認識エンジンによって生成されたイベントをリッスンします。

public async Task SpeechContinuousRecognitionAsync()
{
    // Creates an instance of a speech config with specified subscription key and region.
    // Replace with your own subscription key and service region (e.g., "westus").
    var config = SpeechConfig.FromSubscription("YourSubscriptionKey", "YourServiceRegion");

    // Creates a speech recognizer from microphone.
    using (var recognizer = new SpeechRecognizer(config))
    {
        // Subscribes to events.
        recognizer.Recognizing += (s, e) => {
            Console.WriteLine($"RECOGNIZING: Text={e.Result.Text}");
        };

        recognizer.Recognized += (s, e) => {
            var result = e.Result;
            Console.WriteLine($"Reason: {result.Reason.ToString()}");
            if (result.Reason == ResultReason.RecognizedSpeech)
            {
                    Console.WriteLine($"Final result: Text: {result.Text}.");
            }
        };

        recognizer.Canceled += (s, e) => {
            Console.WriteLine($"\n    Canceled. Reason: {e.Reason.ToString()}, CanceledReason: {e.Reason}");
        };

        recognizer.SessionStarted += (s, e) => {
            Console.WriteLine("\n    Session started event.");
        };

        recognizer.SessionStopped += (s, e) => {
            Console.WriteLine("\n    Session stopped event.");
        };

        // Starts continuous recognition. 
        // Uses StopContinuousRecognitionAsync() to stop recognition.
        await recognizer.StartContinuousRecognitionAsync().ConfigureAwait(false);

        do
        {
            Console.WriteLine("Press Enter to stop");
        } while (Console.ReadKey().Key != ConsoleKey.Enter);

        // Stops recognition.
        await recognizer.StopContinuousRecognitionAsync().ConfigureAwait(false);
    }
}

注釈

音声テキスト変換の概要」も参照してください。

コンストラクター

SpeechRecognizer(EmbeddedSpeechConfig)

既定のマイクから音声を受信するように構成された EmbeddedSpeechConfig を使用して、SpeechRecognizer の新しいインスタンスを作成します。 1.19.0 で追加されました

SpeechRecognizer(EmbeddedSpeechConfig, AudioConfig)

AudioConfig オブジェクトで指定されたオーディオ ソースから音声を受信するように構成された EmbeddedSpeechConfig を使用して、SpeechRecognizer の新しいインスタンスを作成します。 1.19.0 で追加されました

SpeechRecognizer(EmbeddedSpeechConfig, AutoDetectSourceLanguageConfig)

オプションの一覧からソース言語を決定する EmbeddedSpeechConfig を使用して、SpeechRecognizer の新しいインスタンスを作成します。 1.20.0 で追加されました

SpeechRecognizer(EmbeddedSpeechConfig, AutoDetectSourceLanguageConfig, AudioConfig)

オプションの一覧からソース言語を決定する EmbeddedSpeechConfig を使用して、SpeechRecognizer の新しいインスタンスを作成します。 1.20.0 で追加されました

SpeechRecognizer(HybridSpeechConfig)

既定のマイクから音声を受信するように構成された HybridSpeechConfig を使用して、SpeechRecognizer の新しいインスタンスを作成します。

SpeechRecognizer(HybridSpeechConfig, AudioConfig)

AudioConfig オブジェクトで指定されたオーディオ ソースから音声を受信するように構成された HybridSpeechConfig を使用して、SpeechRecognizer の新しいインスタンスを作成します。

SpeechRecognizer(HybridSpeechConfig, AutoDetectSourceLanguageConfig)

オプションの一覧からソース言語を決定する HybridSpeechConfig を使用して、SpeechRecognizer の新しいインスタンスを作成します。

SpeechRecognizer(HybridSpeechConfig, AutoDetectSourceLanguageConfig, AudioConfig)

オプションの一覧からソース言語を決定する HybridSpeechConfig を使用して、SpeechRecognizer の新しいインスタンスを作成します。

SpeechRecognizer(SpeechConfig)

既定のマイクから音声を受信するように構成された SpeechRecognizer の新しいインスタンスを作成します。

SpeechRecognizer(SpeechConfig, AudioConfig)

AudioConfig オブジェクトで指定されたオーディオ ソースから音声を受信するように構成された SpeechRecognizer の新しいインスタンスを作成します。

SpeechRecognizer(SpeechConfig, AutoDetectSourceLanguageConfig)

オプションの一覧からソース言語を決定する SpeechRecognizer の新しいインスタンスを作成します。 1.9.0 で追加されました

SpeechRecognizer(SpeechConfig, AutoDetectSourceLanguageConfig, AudioConfig)

SpeechRecognizer の新しいインスタンスを作成します。 1.9.0 で追加されました

SpeechRecognizer(SpeechConfig, SourceLanguageConfig)

SpeechRecognizer の新しいインスタンスを作成します。 1.9.0 で追加されました

SpeechRecognizer(SpeechConfig, SourceLanguageConfig, AudioConfig)

SpeechRecognizer の新しいインスタンスを作成します。 1.9.0 で追加されました

SpeechRecognizer(SpeechConfig, String)

特定の言語で音声を受信するように構成された SpeechRecognizer の新しいインスタンスを作成します。 1.9.0 で追加されました

SpeechRecognizer(SpeechConfig, String, AudioConfig)

AudioConfig オブジェクトで指定されたオーディオ ソースから特定の言語の音声を受信するように構成された SpeechRecognizer の新しいインスタンスを作成します。 1.9.0 で追加されました

フィールド

disposed

disposed は、オブジェクトが破棄されているかどうかを示すために使用されるフラグです。

(継承元 Recognizer)
gch

コンテキストのコールバックの GC ハンドル。

(継承元 Recognizer)
isDisposing

オブジェクトが現在破棄されているかどうかを示します。

(継承元 Recognizer)
pointerHandle

ログ記録用の内部。

(継承元 Recognizer)
recognizerLock

recognizerLock は、複数のスレッドからオブジェクト メンバー変数へのアクセスを同期するために使用されます

(継承元 Recognizer)

プロパティ

AuthorizationToken

サービスとの通信に使用される承認トークンを取得または設定します。

注: コードでは、認証トークンが有効であることを確認する必要があります。 承認トークンの有効期限が切れる前に、コードで新しい有効なトークンを使用してこのセッターを呼び出して更新する必要があります。 それ以外の場合、認識エンジンは認識中にエラーを生成します。

EndpointId

音声認識に使用するカスタム音声モデルのエンドポイント ID を取得します。

OutputFormat

出力形式の設定を取得します。

Properties

この SpeechRecognizerに対して定義されているプロパティとその値のコレクション。 注: プロパティ コレクションは、このプロパティを所有する認識エンジンが破棄または最終処理されるまでのみ有効です。

SpeechRecognitionLanguage

認識エンジンの作成時に設定された言語名を取得します。

メソッド

Dispose()

関連付けられているリソースを破棄します。

(継承元 Recognizer)
Dispose(Boolean)

このメソッドは、リソースのクリーンアップを実行します。 Boolean パラメーターdisposingは、メソッドが (true の場合) またはファイナライザー (Dispose()が false の場合disposingdisposing) から呼び出されるかどうかを示します。 必要に応じて、派生クラスがこのメソッドをオーバーライドしてリソースを破棄する必要があります。

(継承元 Recognizer)
Finalize()

音声をテキストに文字起こしします。 音声は、マイク、オーディオ ファイル、またはその他のオーディオ入力ストリームを介して受信できます。

RecognizeOnceAsync()

非同期操作として音声認識を開始します。

StartContinuousRecognitionAsync()

StopContinuousRecognitionAsync() が呼び出されるまで、継続的なオーディオ ストリームで非同期操作として音声認識を開始します。 認識結果を受信するには、イベントをサブスクライブする必要があります。

StartKeywordRecognitionAsync(KeywordRecognitionModel)

指定したキーワード (keyword) モデルを使用して認識エンジンを構成します。 このメソッドを呼び出した後、認識エンジンは認識を開始するキーワード (keyword)をリッスンしています。 StopKeywordRecognitionAsync() を呼び出して、キーワード (keyword)開始された認識を終了します。 認識結果を受信するには、イベントをサブスクライブする必要があります。

StopContinuousRecognitionAsync()

実行中の認識操作をできるだけ早く停止し、これまでに処理された入力に基づいてすぐに結果を要求します。 これは、継続的な操作だけでなく、すべての認識操作に対して機能し、手動オーディオ エンドポイントのプッシュツートークまたは "今すぐ終了" ボタンの使用を容易にします。

StopKeywordRecognitionAsync()

キーワード (keyword)開始された認識を終了します。

イベント

Canceled

このイベント Canceled は、音声認識が取り消されたことを通知します。

Recognized

イベント Recognized は、最終的な認識結果が受信されたことを通知します。

Recognizing

イベント Recognizing は、中間認識結果が受信されたことを通知します。

SessionStarted

セッション開始イベントのイベント ハンドラーを定義します。

(継承元 Recognizer)
SessionStopped

セッション停止イベントのイベント ハンドラーを定義します。

(継承元 Recognizer)
SpeechEndDetected

音声終了検出イベントのイベント ハンドラーを定義します。

(継承元 Recognizer)
SpeechStartDetected

音声開始検出イベントのイベント ハンドラーを定義します。

(継承元 Recognizer)

適用対象