SpeechRecognizer Klasse

public final class SpeechRecognizer
extends Recognizer

Führt die Spracherkennung aus Mikrofon-, Datei- oder anderen Audioeingabestreams aus und ruft als Ergebnis transkribierten Text ab. Hinweis: close() muss aufgerufen werden, um zugrunde liegende Ressourcen freizugeben, die sich im Besitz des -Objekts befinden.

Feldzusammenfassung

Modifizierer und Typ Feld und Beschreibung
final EventHandlerImpl<SpeechRecognitionCanceledEventArgs> canceled

Das ereignisabbruch signalisiert, dass die Erkennung abgebrochen wurde.

final EventHandlerImpl<SpeechRecognitionEventArgs> recognized

Das erkannte Ereignis signalisiert, dass ein endgültiges Erkennungsergebnis empfangen wird.

final EventHandlerImpl<SpeechRecognitionEventArgs> recognizing

Das Ereignis, das erkennt, signalisiert, dass ein Zwischenerkennungsergebnis empfangen wird.

Zusammenfassung zum Konstruktor

Konstruktor Beschreibung
SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig)

Initialisiert eine neue instance der Spracherkennung für die eingebettete Spracherkennung.

SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)

Initialisiert eine neue instance der Spracherkennung für die eingebettete Spracherkennung.

SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)

Initialisiert eine neue instance der Spracherkennung für die eingebettete Spracherkennung.

SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AudioConfig audioConfig)

Initialisiert eine neue instance der Spracherkennung für die eingebettete Spracherkennung.

SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig)

Initialisiert einen neuen instance der Spracherkennung für die hybride Spracherkennung.

SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)

Initialisiert einen neuen instance der Spracherkennung für die hybride Spracherkennung.

SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)

Initialisiert einen neuen instance der Spracherkennung für die hybride Spracherkennung.

SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AudioConfig audioConfig)

Initialisiert eine neue instance der Spracherkennung für die hybride Spracherkennung.

SpeechRecognizer(SpeechConfig speechConfig)

Initialisiert eine neue instance der Spracherkennung.

SpeechRecognizer(SpeechConfig speechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)

Initialisiert eine neue instance der Spracherkennung.

SpeechRecognizer(SpeechConfig speechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)

Initialisiert eine neue instance der Spracherkennung.

SpeechRecognizer(SpeechConfig speechConfig, SourceLanguageConfig sourceLanguageConfig)

Initialisiert eine neue instance der Spracherkennung.

SpeechRecognizer(SpeechConfig speechConfig, SourceLanguageConfig sourceLanguageConfig, AudioConfig audioConfig)

Initialisiert eine neue instance der Spracherkennung.

SpeechRecognizer(SpeechConfig speechConfig, AudioConfig audioConfig)

Initialisiert eine neue instance der Spracherkennung.

SpeechRecognizer(SpeechConfig speechConfig, String sourceLanguage)

Initialisiert eine neue instance der Spracherkennung.

SpeechRecognizer(SpeechConfig speechConfig, String sourceLanguage, AudioConfig audioConfig)

Initialisiert eine neue instance der Spracherkennung.

Methodenzusammenfassung

Modifizierer und Typ Methode und Beschreibung
protected void dispose(boolean disposing)

Diese Methode führt eine Bereinigung von Ressourcen durch.

java.lang.String getAuthorizationToken()

Ruft das Autorisierungstoken ab, das für die Kommunikation mit dem Dienst verwendet wird.

java.lang.String getEndpointId()

Ruft die Endpunkt-ID eines benutzerdefinierten Sprachmodells ab, das für die Spracherkennung verwendet wird.

OutputFormat getOutputFormat()

Ruft das Ausgabeformat der Erkennung ab.

PropertyCollection getProperties()

Die Auflistung der Eigenschaften und deren Werte, die für diese Spracherkennungdefiniert sind.

java.lang.String getSpeechRecognitionLanguage()

Ruft die gesprochene Erkennungssprache ab.

java.util.concurrent.Future<SpeechRecognitionResult> recognizeOnceAsync()

Startet die Spracherkennung und kehrt zurück, nachdem eine einzelne Äußerung erkannt wurde.

void setAuthorizationToken(String token)

Legt das Autorisierungstoken fest, das für die Kommunikation mit dem Dienst verwendet wird.

java.util.concurrent.Future<java.lang.Void> startContinuousRecognitionAsync()

Startet die Spracherkennung für einen kontinuierlichen Audiodatenstrom, bis "ContinuousRecognitionAsync()"aufgerufen wird.

java.util.concurrent.Future<java.lang.Void> startKeywordRecognitionAsync(KeywordRecognitionModel model)

Konfiguriert die Erkennung mit dem angegebenen Schlüsselwort (keyword)-Modell.

java.util.concurrent.Future<java.lang.Void> stopContinuousRecognitionAsync()

Beendet einen ausgeführten Erkennungsvorgang so schnell wie möglich und fordert sofort ein Ergebnis basierend auf der Eingabe an, die bisher verarbeitet wurde.

java.util.concurrent.Future<java.lang.Void> stopKeywordRecognitionAsync()

Beendet die Schlüsselwort (keyword) initiierte Erkennung.

Geerbte Methoden von Recognizer

Geerbte Methoden von java.lang.Object

java.lang.Object.clone java.lang.Object.equals java.lang.Object.finalize java.lang.Object.getClass java.lang.Object.hashCode java.lang.Object.notify java.lang.Object.notifyAll java.lang.Object.toString java.lang.Object.wait java.lang.Object.wait java.lang.Object.wait

Felddetails

canceled

public final EventHandlerImpl canceled

Das ereignisabbruch signalisiert, dass die Erkennung abgebrochen wurde.

recognized

public final EventHandlerImpl recognized

Das erkannte Ereignis signalisiert, dass ein endgültiges Erkennungsergebnis empfangen wird.

recognizing

public final EventHandlerImpl recognizing

Das Ereignis, das erkennt, signalisiert, dass ein Zwischenerkennungsergebnis empfangen wird.

Details zum Konstruktor

SpeechRecognizer

public SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig)

Initialisiert eine neue instance der Spracherkennung für die eingebettete Spracherkennung. In Version 1.19.0 hinzugefügt

Parameters:

embeddedSpeechConfig - Eingebettete Sprachkonfiguration.

SpeechRecognizer

public SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)

Initialisiert eine neue instance der Spracherkennung für die eingebettete Spracherkennung. Hinzugefügt in Version 1.20.0

Parameters:

embeddedSpeechConfig - Eingebettete Sprachkonfiguration.
autoDetectSourceLangConfig - Konfiguration für die automatische Erkennung der Quellsprache.

SpeechRecognizer

public SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)

Initialisiert eine neue instance der Spracherkennung für die eingebettete Spracherkennung. Hinzugefügt in Version 1.20.0

Parameters:

embeddedSpeechConfig - Eingebettete Sprachkonfiguration.
autoDetectSourceLangConfig - Konfiguration für die automatische Erkennung der Quellsprache.
audioConfig - Audiokonfiguration.

SpeechRecognizer

public SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AudioConfig audioConfig)

Initialisiert eine neue instance der Spracherkennung für die eingebettete Spracherkennung. In Version 1.19.0 hinzugefügt

Parameters:

embeddedSpeechConfig - Eingebettete Sprachkonfiguration.
audioConfig - Audiokonfiguration.

SpeechRecognizer

public SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig)

Initialisiert einen neuen instance der Spracherkennung für die hybride Spracherkennung.

Parameters:

hybridSpeechConfig - hybride Sprachkonfiguration.

SpeechRecognizer

public SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)

Initialisiert einen neuen instance der Spracherkennung für die hybride Spracherkennung.

Parameters:

hybridSpeechConfig - hybride Sprachkonfiguration.
autoDetectSourceLangConfig - Die Konfiguration für die automatische Erkennung der Quellsprache

SpeechRecognizer

public SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)

Initialisiert einen neuen instance der Spracherkennung für die hybride Spracherkennung.

Parameters:

hybridSpeechConfig - hybride Sprachkonfiguration.
autoDetectSourceLangConfig - Die Konfiguration für die automatische Erkennung der Quellsprache
audioConfig - Audiokonfiguration.

SpeechRecognizer

public SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AudioConfig audioConfig)

Initialisiert einen neuen instance der Spracherkennung für die hybride Spracherkennung.

Parameters:

hybridSpeechConfig - hybride Sprachkonfiguration.
audioConfig - Audiokonfiguration.

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig)

Initialisiert eine neue instance der Spracherkennung.

Parameters:

speechConfig - Sprachkonfiguration.

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)

Initialisiert eine neue instance der Spracherkennung.

Parameters:

speechConfig - Sprachkonfiguration.
autoDetectSourceLangConfig - Die Konfiguration für die automatische Erkennung der Quellsprache

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)

Initialisiert eine neue instance der Spracherkennung.

Parameters:

speechConfig - Sprachkonfiguration.
autoDetectSourceLangConfig - Die Konfiguration für die automatische Erkennung der Quellsprache
audioConfig - Audiokonfiguration.

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, SourceLanguageConfig sourceLanguageConfig)

Initialisiert eine neue instance der Spracherkennung.

Parameters:

speechConfig - Sprachkonfiguration.
sourceLanguageConfig - die Konfiguration für die Quellsprache

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, SourceLanguageConfig sourceLanguageConfig, AudioConfig audioConfig)

Initialisiert eine neue instance der Spracherkennung.

Parameters:

speechConfig - Sprachkonfiguration.
sourceLanguageConfig - die Konfiguration für die Quellsprache
audioConfig - Audiokonfiguration.

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, AudioConfig audioConfig)

Initialisiert eine neue instance der Spracherkennung.

Parameters:

speechConfig - Sprachkonfiguration.
audioConfig - Audiokonfiguration.

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, String sourceLanguage)

Initialisiert eine neue instance der Spracherkennung.

Parameters:

speechConfig - Sprachkonfiguration.
sourceLanguage - die Erkennungsquellsprache

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, String sourceLanguage, AudioConfig audioConfig)

Initialisiert eine neue instance der Spracherkennung.

Parameters:

speechConfig - Sprachkonfiguration.
sourceLanguage - die Erkennungsquellsprache
audioConfig - Audiokonfiguration.

Details zur Methode

dispose

protected void dispose(boolean disposing)

Diese Methode führt eine Bereinigung von Ressourcen durch. Der verwerfende boolesche Parameter gibt an, ob die Methode von Dispose (wenn die Entsorgung true ist) oder vom Finalizer (wenn die Entsorgung false ist) aufgerufen wird. Abgeleitete Klassen sollten diese Methode überschreiben, um bei Bedarf Ressourcen zu entsorgen.

Overrides:

SpeechRecognizer.dispose(boolean disposing)

Parameters:

disposing

getAuthorizationToken

public String getAuthorizationToken()

Ruft das Autorisierungstoken ab, das für die Kommunikation mit dem Dienst verwendet wird.

Returns:

Autorisierungstoken.

getEndpointId

public String getEndpointId()

Ruft die Endpunkt-ID eines benutzerdefinierten Sprachmodells ab, das für die Spracherkennung verwendet wird.

Returns:

die Endpunkt-ID eines benutzerdefinierten Sprachmodells, das für die Spracherkennung verwendet wird.

getOutputFormat

public OutputFormat getOutputFormat()

Ruft das Ausgabeformat der Erkennung ab.

Returns:

Das Ausgabeformat der Erkennung.

getProperties

public PropertyCollection getProperties()

Die Auflistung der Eigenschaften und deren Werte, die für diesen SpeechRecognizer definiert sind.

Returns:

Die Auflistung der Eigenschaften und deren Werte, die für diesen SpeechRecognizer definiert sind.

getSpeechRecognitionLanguage

public String getSpeechRecognitionLanguage()

Ruft die gesprochene Erkennungssprache ab.

Returns:

Die gesprochene Erkennungssprache.

recognizeOnceAsync

public Future recognizeOnceAsync()

Startet die Spracherkennung und kehrt zurück, nachdem eine einzelne Äußerung erkannt wurde. Zur Erkennung des Endes einer einzelnen Äußerung wird auf Stille am Ende gelauscht oder gewartet, bis maximal 15 Sekunden an Audiodaten verarbeitet wurden. Die Aufgabe gibt als Ergebnis den Erkennungstext zurück. Hinweis: Da recognizeOnceAsync() nur eine einzelne Äußerung zurückgibt, eignet sie sich nur für die Einzelschusserkennung wie Befehl oder Abfrage. Verwenden Sie stattdessen startContinuousRecognitionAsync() für die Erkennung von mehreren Äußerungen mit langer Ausführungsdauer.

Returns:

Eine Aufgabe, die den Erkennungsvorgang darstellt. Der Task gibt den Wert SpeechRecognitionResult zurück.

setAuthorizationToken

public void setAuthorizationToken(String token)

Legt das Autorisierungstoken fest, das für die Kommunikation mit dem Dienst verwendet wird. Hinweis: Der Aufrufer muss sicherstellen, dass das Autorisierungstoken gültig ist. Bevor das Autorisierungstoken abläuft, muss der Aufrufer es aktualisieren, indem er diesen Setter mit einem neuen gültigen Token aufruft. Andernfalls treten bei der Erkennung Fehler auf.

Parameters:

token - Autorisierungstoken.

startContinuousRecognitionAsync

public Future startContinuousRecognitionAsync()

Startet die Spracherkennung für einen kontinuierlichen Audiostream, bis stopContinuousRecognitionAsync() aufgerufen wird. Der Benutzer muss Ereignisse abonnieren, um Erkennungsergebnisse zu erhalten.

Returns:

Eine Aufgabe, die den asynchronen Vorgang darstellt, der die Erkennung startet.

startKeywordRecognitionAsync

public Future startKeywordRecognitionAsync(KeywordRecognitionModel model)

Konfiguriert die Erkennung mit dem angegebenen Schlüsselwort (keyword)-Modell. Nach dem Aufrufen dieser Methode lauscht die Erkennung auf den Schlüsselwort (keyword), um die Erkennung zu starten. Rufen Sie stopKeywordRecognitionAsync() auf, um die Schlüsselwort (keyword) initiierte Erkennung zu beenden. Der Benutzer muss Ereignisse abonnieren, um Erkennungsergebnisse zu erhalten.

Parameters:

model - Das Schlüsselwort (keyword) Erkennungsmodell, das die zu erkennende Schlüsselwort (keyword) angibt.

Returns:

Eine Aufgabe, die den asynchronen Vorgang darstellt, der die Erkennung startet.

stopContinuousRecognitionAsync

public Future stopContinuousRecognitionAsync()

Beendet einen ausgeführten Erkennungsvorgang so schnell wie möglich und fordert sofort ein Ergebnis basierend auf der Eingabe an, die bisher verarbeitet wurde. Dies funktioniert für alle Erkennungsvorgänge, nicht nur für fortlaufende Vorgänge, und erleichtert die Verwendung von Push-to-Talk- oder "Jetzt beenden"-Schaltflächen für manuelle Audioendpunkte.

Returns:

Eine Zukunft, die abgeschlossen wird, wenn die Eingabeverarbeitung beendet wurde. Die Ergebnisgenerierung kann, falls für die angegebene Eingabe zutreffend, nach Abschluss dieser Aufgabe erfolgen und sollte mit dem entsprechenden Ereignis behandelt werden.

stopKeywordRecognitionAsync

public Future stopKeywordRecognitionAsync()

Beendet die Schlüsselwort (keyword) initiierte Erkennung.

Returns:

Eine Aufgabe, die den asynchronen Vorgang darstellt, der die Erkennung beendet.

Gilt für: