SpeechRecognizer Klasse

Referenz

Paket:: com.microsoft.cognitiveservices.speech

Maven-Artefakt:: com.microsoft.cognitiveservices.speech:client-sdk:1.38.0

java.lang.Object
- com.microsoft.cognitiveservices.speech.Recognizer
- - com.microsoft.cognitiveservices.speech.SpeechRecognizer

public final class SpeechRecognizer
extends Recognizer

Führt die Spracherkennung aus Mikrofon-, Datei- oder anderen Audioeingabestreams aus und ruft als Ergebnis transkribierten Text ab. Hinweis: close() muss aufgerufen werden, um zugrunde liegende Ressourcen freizugeben, die sich im Besitz des -Objekts befinden.

Feldzusammenfassung

Modifizierer und Typ	Feld und Beschreibung
final EventHandlerImpl<SpeechRecognitionCanceledEventArgs>	canceled Das ereignisabbruch signalisiert, dass die Erkennung abgebrochen wurde.
final EventHandlerImpl<SpeechRecognitionEventArgs>	recognized Das erkannte Ereignis signalisiert, dass ein endgültiges Erkennungsergebnis empfangen wird.
final EventHandlerImpl<SpeechRecognitionEventArgs>	recognizing Das Ereignis, das erkennt, signalisiert, dass ein Zwischenerkennungsergebnis empfangen wird.

Zusammenfassung zum Konstruktor

Konstruktor	Beschreibung
SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig)	Initialisiert eine neue instance der Spracherkennung für die eingebettete Spracherkennung.
SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)	Initialisiert eine neue instance der Spracherkennung für die eingebettete Spracherkennung.
SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)	Initialisiert eine neue instance der Spracherkennung für die eingebettete Spracherkennung.
SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AudioConfig audioConfig)	Initialisiert eine neue instance der Spracherkennung für die eingebettete Spracherkennung.
SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig)	Initialisiert einen neuen instance der Spracherkennung für die hybride Spracherkennung.
SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)	Initialisiert einen neuen instance der Spracherkennung für die hybride Spracherkennung.
SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)	Initialisiert einen neuen instance der Spracherkennung für die hybride Spracherkennung.
SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AudioConfig audioConfig)	Initialisiert eine neue instance der Spracherkennung für die hybride Spracherkennung.
SpeechRecognizer(SpeechConfig speechConfig)	Initialisiert eine neue instance der Spracherkennung.
SpeechRecognizer(SpeechConfig speechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)	Initialisiert eine neue instance der Spracherkennung.
SpeechRecognizer(SpeechConfig speechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)	Initialisiert eine neue instance der Spracherkennung.
SpeechRecognizer(SpeechConfig speechConfig, SourceLanguageConfig sourceLanguageConfig)	Initialisiert eine neue instance der Spracherkennung.
SpeechRecognizer(SpeechConfig speechConfig, SourceLanguageConfig sourceLanguageConfig, AudioConfig audioConfig)	Initialisiert eine neue instance der Spracherkennung.
SpeechRecognizer(SpeechConfig speechConfig, AudioConfig audioConfig)	Initialisiert eine neue instance der Spracherkennung.
SpeechRecognizer(SpeechConfig speechConfig, String sourceLanguage)	Initialisiert eine neue instance der Spracherkennung.
SpeechRecognizer(SpeechConfig speechConfig, String sourceLanguage, AudioConfig audioConfig)	Initialisiert eine neue instance der Spracherkennung.

Methodenzusammenfassung

Modifizierer und Typ	Methode und Beschreibung
protected void	dispose(boolean disposing) Diese Methode führt eine Bereinigung von Ressourcen durch.
java.lang.String	getAuthorizationToken() Ruft das Autorisierungstoken ab, das für die Kommunikation mit dem Dienst verwendet wird.
java.lang.String	getEndpointId() Ruft die Endpunkt-ID eines benutzerdefinierten Sprachmodells ab, das für die Spracherkennung verwendet wird.
OutputFormat	getOutputFormat() Ruft das Ausgabeformat der Erkennung ab.
PropertyCollection	getProperties() Die Auflistung der Eigenschaften und deren Werte, die für diese Spracherkennungdefiniert sind.
java.lang.String	getSpeechRecognitionLanguage() Ruft die gesprochene Erkennungssprache ab.
java.util.concurrent.Future<SpeechRecognitionResult>	recognizeOnceAsync() Startet die Spracherkennung und kehrt zurück, nachdem eine einzelne Äußerung erkannt wurde.
void	setAuthorizationToken(String token) Legt das Autorisierungstoken fest, das für die Kommunikation mit dem Dienst verwendet wird.
java.util.concurrent.Future<java.lang.Void>	startContinuousRecognitionAsync() Startet die Spracherkennung für einen kontinuierlichen Audiodatenstrom, bis "ContinuousRecognitionAsync()"aufgerufen wird.
java.util.concurrent.Future<java.lang.Void>	startKeywordRecognitionAsync(KeywordRecognitionModel model) Konfiguriert die Erkennung mit dem angegebenen Schlüsselwort (keyword)-Modell.
java.util.concurrent.Future<java.lang.Void>	stopContinuousRecognitionAsync() Beendet einen ausgeführten Erkennungsvorgang so schnell wie möglich und fordert sofort ein Ergebnis basierend auf der Eingabe an, die bisher verarbeitet wurde.
java.util.concurrent.Future<java.lang.Void>	stopKeywordRecognitionAsync() Beendet die Schlüsselwort (keyword) initiierte Erkennung.

Geerbte Methoden von Recognizer

Geerbte Methoden von java.lang.Object

java.lang.Object.clone java.lang.Object.equals java.lang.Object.finalize java.lang.Object.getClass java.lang.Object.hashCode java.lang.Object.notify java.lang.Object.notifyAll java.lang.Object.toString java.lang.Object.wait java.lang.Object.wait java.lang.Object.wait

Felddetails

canceled

public final EventHandlerImpl canceled

Das ereignisabbruch signalisiert, dass die Erkennung abgebrochen wurde.

recognized

public final EventHandlerImpl recognized

Das erkannte Ereignis signalisiert, dass ein endgültiges Erkennungsergebnis empfangen wird.

recognizing

public final EventHandlerImpl recognizing

Das Ereignis, das erkennt, signalisiert, dass ein Zwischenerkennungsergebnis empfangen wird.

Details zum Konstruktor

SpeechRecognizer

public SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig)

Initialisiert eine neue instance der Spracherkennung für die eingebettete Spracherkennung. In Version 1.19.0 hinzugefügt

Parameter:

embeddedSpeechConfig - Eingebettete Sprachkonfiguration.

SpeechRecognizer

public SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)

Initialisiert eine neue instance der Spracherkennung für die eingebettete Spracherkennung. Hinzugefügt in Version 1.20.0

Parameter:

embeddedSpeechConfig - Eingebettete Sprachkonfiguration.

autoDetectSourceLangConfig - Konfiguration für die automatische Erkennung der Quellsprache.

SpeechRecognizer

public SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)

Initialisiert eine neue instance der Spracherkennung für die eingebettete Spracherkennung. Hinzugefügt in Version 1.20.0

Parameter:

embeddedSpeechConfig - Eingebettete Sprachkonfiguration.

autoDetectSourceLangConfig - Konfiguration für die automatische Erkennung der Quellsprache.

audioConfig - Audiokonfiguration.

SpeechRecognizer

public SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AudioConfig audioConfig)

Initialisiert eine neue instance der Spracherkennung für die eingebettete Spracherkennung. In Version 1.19.0 hinzugefügt

Parameter:

embeddedSpeechConfig - Eingebettete Sprachkonfiguration.

audioConfig - Audiokonfiguration.

SpeechRecognizer

public SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig)

Initialisiert einen neuen instance der Spracherkennung für die hybride Spracherkennung.

Parameter:

hybridSpeechConfig - hybride Sprachkonfiguration.

SpeechRecognizer

public SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)

Initialisiert einen neuen instance der Spracherkennung für die hybride Spracherkennung.

Parameter:

hybridSpeechConfig - hybride Sprachkonfiguration.

autoDetectSourceLangConfig - Die Konfiguration für die automatische Erkennung der Quellsprache

SpeechRecognizer

public SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)

Initialisiert einen neuen instance der Spracherkennung für die hybride Spracherkennung.

Parameter:

hybridSpeechConfig - hybride Sprachkonfiguration.

autoDetectSourceLangConfig - Die Konfiguration für die automatische Erkennung der Quellsprache

audioConfig - Audiokonfiguration.

SpeechRecognizer

public SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AudioConfig audioConfig)

Initialisiert einen neuen instance der Spracherkennung für die hybride Spracherkennung.

Parameter:

hybridSpeechConfig - hybride Sprachkonfiguration.

audioConfig - Audiokonfiguration.

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig)

Initialisiert eine neue instance der Spracherkennung.

Parameter:

speechConfig - Sprachkonfiguration.

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)

Initialisiert eine neue instance der Spracherkennung.

Parameter:

speechConfig - Sprachkonfiguration.

autoDetectSourceLangConfig - Die Konfiguration für die automatische Erkennung der Quellsprache

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)

Initialisiert eine neue instance der Spracherkennung.

Parameter:

speechConfig - Sprachkonfiguration.

autoDetectSourceLangConfig - Die Konfiguration für die automatische Erkennung der Quellsprache

audioConfig - Audiokonfiguration.

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, SourceLanguageConfig sourceLanguageConfig)

Initialisiert eine neue instance der Spracherkennung.

Parameter:

speechConfig - Sprachkonfiguration.

sourceLanguageConfig - die Konfiguration für die Quellsprache

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, SourceLanguageConfig sourceLanguageConfig, AudioConfig audioConfig)

Initialisiert eine neue instance der Spracherkennung.

Parameter:

speechConfig - Sprachkonfiguration.

sourceLanguageConfig - die Konfiguration für die Quellsprache

audioConfig - Audiokonfiguration.

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, AudioConfig audioConfig)

Initialisiert eine neue instance der Spracherkennung.

Parameter:

speechConfig - Sprachkonfiguration.

audioConfig - Audiokonfiguration.

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, String sourceLanguage)

Initialisiert eine neue instance der Spracherkennung.

Parameter:

speechConfig - Sprachkonfiguration.

sourceLanguage - die Erkennungsquellsprache

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, String sourceLanguage, AudioConfig audioConfig)

Initialisiert eine neue instance der Spracherkennung.

Parameter:

speechConfig - Sprachkonfiguration.

sourceLanguage - die Erkennungsquellsprache

audioConfig - Audiokonfiguration.

Details zur Methode

dispose

protected void dispose(boolean disposing)

Diese Methode führt eine Bereinigung von Ressourcen durch. Der verwerfende boolesche Parameter gibt an, ob die Methode von Dispose (wenn die Entsorgung true ist) oder vom Finalizer (wenn die Entsorgung false ist) aufgerufen wird. Abgeleitete Klassen sollten diese Methode überschreiben, um bei Bedarf Ressourcen zu entsorgen.

Überschreibt:

SpeechRecognizer.dispose(boolean disposing)

Parameter:

disposing

getAuthorizationToken

public String getAuthorizationToken()

Ruft das Autorisierungstoken ab, das für die Kommunikation mit dem Dienst verwendet wird.

Gibt zurück:

Autorisierungstoken.

getEndpointId

public String getEndpointId()

Ruft die Endpunkt-ID eines benutzerdefinierten Sprachmodells ab, das für die Spracherkennung verwendet wird.

Gibt zurück:

die Endpunkt-ID eines benutzerdefinierten Sprachmodells, das für die Spracherkennung verwendet wird.

getOutputFormat

public OutputFormat getOutputFormat()

Ruft das Ausgabeformat der Erkennung ab.

Gibt zurück:

Das Ausgabeformat der Erkennung.

getProperties

public PropertyCollection getProperties()

Die Auflistung der Eigenschaften und deren Werte, die für diesen SpeechRecognizer definiert sind.

Gibt zurück:

Die Auflistung der Eigenschaften und deren Werte, die für diesen SpeechRecognizer definiert sind.

getSpeechRecognitionLanguage

public String getSpeechRecognitionLanguage()

Ruft die gesprochene Erkennungssprache ab.

Gibt zurück:

Die gesprochene Erkennungssprache.

recognizeOnceAsync

public Future recognizeOnceAsync()

Startet die Spracherkennung und kehrt zurück, nachdem eine einzelne Äußerung erkannt wurde. Zur Erkennung des Endes einer einzelnen Äußerung wird auf Stille am Ende gelauscht oder gewartet, bis maximal 15 Sekunden an Audiodaten verarbeitet wurden. Die Aufgabe gibt als Ergebnis den Erkennungstext zurück. Hinweis: Da recognizeOnceAsync() nur eine einzelne Äußerung zurückgibt, eignet sie sich nur für die Einzelschusserkennung wie Befehl oder Abfrage. Verwenden Sie stattdessen startContinuousRecognitionAsync() für die Erkennung von mehreren Äußerungen mit langer Ausführungsdauer.

Gibt zurück:

Eine Aufgabe, die den Erkennungsvorgang darstellt. Der Task gibt den Wert SpeechRecognitionResult zurück.

setAuthorizationToken

public void setAuthorizationToken(String token)

Legt das Autorisierungstoken fest, das für die Kommunikation mit dem Dienst verwendet wird. Hinweis: Der Aufrufer muss sicherstellen, dass das Autorisierungstoken gültig ist. Bevor das Autorisierungstoken abläuft, muss der Aufrufer es aktualisieren, indem er diesen Setter mit einem neuen gültigen Token aufruft. Andernfalls treten bei der Erkennung Fehler auf.

Parameter:

token - Autorisierungstoken.

startContinuousRecognitionAsync

public Future startContinuousRecognitionAsync()

Startet die Spracherkennung für einen kontinuierlichen Audiostream, bis stopContinuousRecognitionAsync() aufgerufen wird. Der Benutzer muss Ereignisse abonnieren, um Erkennungsergebnisse zu erhalten.

Gibt zurück:

Eine Aufgabe, die den asynchronen Vorgang darstellt, der die Erkennung startet.

startKeywordRecognitionAsync

public Future startKeywordRecognitionAsync(KeywordRecognitionModel model)

Konfiguriert die Erkennung mit dem angegebenen Schlüsselwort (keyword)-Modell. Nach dem Aufrufen dieser Methode lauscht die Erkennung auf den Schlüsselwort (keyword), um die Erkennung zu starten. Rufen Sie stopKeywordRecognitionAsync() auf, um die Schlüsselwort (keyword) initiierte Erkennung zu beenden. Der Benutzer muss Ereignisse abonnieren, um Erkennungsergebnisse zu erhalten.

Parameter:

model - Das Schlüsselwort (keyword) Erkennungsmodell, das die zu erkennende Schlüsselwort (keyword) angibt.

Gibt zurück:

Eine Aufgabe, die den asynchronen Vorgang darstellt, der die Erkennung startet.

stopContinuousRecognitionAsync

public Future stopContinuousRecognitionAsync()

Beendet einen ausgeführten Erkennungsvorgang so schnell wie möglich und fordert sofort ein Ergebnis basierend auf der Eingabe an, die bisher verarbeitet wurde. Dies funktioniert für alle Erkennungsvorgänge, nicht nur für fortlaufende Vorgänge, und erleichtert die Verwendung von Push-to-Talk- oder "Jetzt beenden"-Schaltflächen für manuelle Audioendpunkte.

Gibt zurück:

Eine Zukunft, die abgeschlossen wird, wenn die Eingabeverarbeitung beendet wurde. Die Ergebnisgenerierung kann, falls für die angegebene Eingabe zutreffend, nach Abschluss dieser Aufgabe erfolgen und sollte mit dem entsprechenden Ereignis behandelt werden.

stopKeywordRecognitionAsync

public Future stopKeywordRecognitionAsync()

Beendet die Schlüsselwort (keyword) initiierte Erkennung.

Gibt zurück:

Eine Aufgabe, die den asynchronen Vorgang darstellt, der die Erkennung beendet.

Freigeben über

SpeechRecognizer Klasse

Feldzusammenfassung

Zusammenfassung zum Konstruktor

Methodenzusammenfassung

Geerbte Methoden von Recognizer

Geerbte Methoden von java.lang.Object

Felddetails

canceled

recognized

recognizing

Details zum Konstruktor

SpeechRecognizer

SpeechRecognizer

SpeechRecognizer

SpeechRecognizer

SpeechRecognizer

SpeechRecognizer

SpeechRecognizer

SpeechRecognizer

SpeechRecognizer

SpeechRecognizer

SpeechRecognizer

SpeechRecognizer

SpeechRecognizer

SpeechRecognizer

SpeechRecognizer

SpeechRecognizer

Details zur Methode

dispose

getAuthorizationToken

getEndpointId

getOutputFormat

getProperties

getSpeechRecognitionLanguage

recognizeOnceAsync

setAuthorizationToken

startContinuousRecognitionAsync

startKeywordRecognitionAsync

stopContinuousRecognitionAsync

stopKeywordRecognitionAsync

Gilt für:

Feedback

Zusätzliche Ressourcen