SpeechRecognizer Klasse
- java.
lang. Object - com.
microsoft. cognitiveservices. speech. Recognizer - com.
microsoft. cognitiveservices. speech. SpeechRecognizer
- com.
- com.
public final class SpeechRecognizer
extends Recognizer
Führt die Spracherkennung aus Mikrofon-, Datei- oder anderen Audioeingabestreams aus und ruft als Ergebnis transkribierten Text ab. Hinweis: close() muss aufgerufen werden, um zugrunde liegende Ressourcen freizugeben, die sich im Besitz des -Objekts befinden.
Feldzusammenfassung
Modifizierer und Typ | Feld und Beschreibung |
---|---|
final
Event |
canceled
Das ereignisabbruch signalisiert, dass die Erkennung abgebrochen wurde. |
final
Event |
recognized
Das erkannte Ereignis signalisiert, dass ein endgültiges Erkennungsergebnis empfangen wird. |
final
Event |
recognizing
Das Ereignis, das erkennt, signalisiert, dass ein Zwischenerkennungsergebnis empfangen wird. |
Zusammenfassung zum Konstruktor
Methodenzusammenfassung
Modifizierer und Typ | Methode und Beschreibung |
---|---|
protected void |
dispose(boolean disposing)
Diese Methode führt eine Bereinigung von Ressourcen durch. |
java.lang.String |
getAuthorizationToken()
Ruft das Autorisierungstoken ab, das für die Kommunikation mit dem Dienst verwendet wird. |
java.lang.String |
getEndpointId()
Ruft die Endpunkt-ID eines benutzerdefinierten Sprachmodells ab, das für die Spracherkennung verwendet wird. |
Output |
getOutputFormat()
Ruft das Ausgabeformat der Erkennung ab. |
Property |
getProperties()
Die Auflistung der Eigenschaften und deren Werte, die für diese Spracherkennung |
java.lang.String |
getSpeechRecognitionLanguage()
Ruft die gesprochene Erkennungssprache ab. |
java.util.concurrent.Future<Speech |
recognizeOnceAsync()
Startet die Spracherkennung und kehrt zurück, nachdem eine einzelne Äußerung erkannt wurde. |
void |
setAuthorizationToken(String token)
Legt das Autorisierungstoken fest, das für die Kommunikation mit dem Dienst verwendet wird. |
java.util.concurrent.Future<java.lang.Void> |
startContinuousRecognitionAsync()
Startet die Spracherkennung für einen kontinuierlichen Audiodatenstrom, bis "Continuous |
java.util.concurrent.Future<java.lang.Void> |
startKeywordRecognitionAsync(KeywordRecognitionModel model)
Konfiguriert die Erkennung mit dem angegebenen Schlüsselwort (keyword)-Modell. |
java.util.concurrent.Future<java.lang.Void> |
stopContinuousRecognitionAsync()
Beendet einen ausgeführten Erkennungsvorgang so schnell wie möglich und fordert sofort ein Ergebnis basierend auf der Eingabe an, die bisher verarbeitet wurde. |
java.util.concurrent.Future<java.lang.Void> |
stopKeywordRecognitionAsync()
Beendet die Schlüsselwort (keyword) initiierte Erkennung. |
Geerbte Methoden von Recognizer
Geerbte Methoden von java.lang.Object
Felddetails
canceled
public final EventHandlerImpl
Das ereignisabbruch signalisiert, dass die Erkennung abgebrochen wurde.
recognized
public final EventHandlerImpl
Das erkannte Ereignis signalisiert, dass ein endgültiges Erkennungsergebnis empfangen wird.
recognizing
public final EventHandlerImpl
Das Ereignis, das erkennt, signalisiert, dass ein Zwischenerkennungsergebnis empfangen wird.
Details zum Konstruktor
SpeechRecognizer
public SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig)
Initialisiert eine neue instance der Spracherkennung für die eingebettete Spracherkennung. In Version 1.19.0 hinzugefügt
Parameter:
SpeechRecognizer
public SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)
Initialisiert eine neue instance der Spracherkennung für die eingebettete Spracherkennung. Hinzugefügt in Version 1.20.0
Parameter:
SpeechRecognizer
public SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)
Initialisiert eine neue instance der Spracherkennung für die eingebettete Spracherkennung. Hinzugefügt in Version 1.20.0
Parameter:
SpeechRecognizer
public SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AudioConfig audioConfig)
Initialisiert eine neue instance der Spracherkennung für die eingebettete Spracherkennung. In Version 1.19.0 hinzugefügt
Parameter:
SpeechRecognizer
public SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig)
Initialisiert einen neuen instance der Spracherkennung für die hybride Spracherkennung.
Parameter:
SpeechRecognizer
public SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)
Initialisiert einen neuen instance der Spracherkennung für die hybride Spracherkennung.
Parameter:
SpeechRecognizer
public SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)
Initialisiert einen neuen instance der Spracherkennung für die hybride Spracherkennung.
Parameter:
SpeechRecognizer
public SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AudioConfig audioConfig)
Initialisiert einen neuen instance der Spracherkennung für die hybride Spracherkennung.
Parameter:
SpeechRecognizer
public SpeechRecognizer(SpeechConfig speechConfig)
Initialisiert eine neue instance der Spracherkennung.
Parameter:
SpeechRecognizer
public SpeechRecognizer(SpeechConfig speechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)
Initialisiert eine neue instance der Spracherkennung.
Parameter:
SpeechRecognizer
public SpeechRecognizer(SpeechConfig speechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)
Initialisiert eine neue instance der Spracherkennung.
Parameter:
SpeechRecognizer
public SpeechRecognizer(SpeechConfig speechConfig, SourceLanguageConfig sourceLanguageConfig)
Initialisiert eine neue instance der Spracherkennung.
Parameter:
SpeechRecognizer
public SpeechRecognizer(SpeechConfig speechConfig, SourceLanguageConfig sourceLanguageConfig, AudioConfig audioConfig)
Initialisiert eine neue instance der Spracherkennung.
Parameter:
SpeechRecognizer
public SpeechRecognizer(SpeechConfig speechConfig, AudioConfig audioConfig)
Initialisiert eine neue instance der Spracherkennung.
Parameter:
SpeechRecognizer
public SpeechRecognizer(SpeechConfig speechConfig, String sourceLanguage)
Initialisiert eine neue instance der Spracherkennung.
Parameter:
SpeechRecognizer
public SpeechRecognizer(SpeechConfig speechConfig, String sourceLanguage, AudioConfig audioConfig)
Initialisiert eine neue instance der Spracherkennung.
Parameter:
Details zur Methode
dispose
protected void dispose(boolean disposing)
Diese Methode führt eine Bereinigung von Ressourcen durch. Der verwerfende boolesche Parameter gibt an, ob die Methode von Dispose (wenn die Entsorgung true ist) oder vom Finalizer (wenn die Entsorgung false ist) aufgerufen wird. Abgeleitete Klassen sollten diese Methode überschreiben, um bei Bedarf Ressourcen zu entsorgen.
Überschreibt:
SpeechRecognizer.dispose(boolean disposing)Parameter:
getAuthorizationToken
public String getAuthorizationToken()
Ruft das Autorisierungstoken ab, das für die Kommunikation mit dem Dienst verwendet wird.
Gibt zurück:
getEndpointId
public String getEndpointId()
Ruft die Endpunkt-ID eines benutzerdefinierten Sprachmodells ab, das für die Spracherkennung verwendet wird.
Gibt zurück:
getOutputFormat
public OutputFormat getOutputFormat()
Ruft das Ausgabeformat der Erkennung ab.
Gibt zurück:
getProperties
public PropertyCollection getProperties()
Die Auflistung der Eigenschaften und deren Werte, die für diesen SpeechRecognizer definiert sind.
Gibt zurück:
getSpeechRecognitionLanguage
public String getSpeechRecognitionLanguage()
Ruft die gesprochene Erkennungssprache ab.
Gibt zurück:
recognizeOnceAsync
public Future
Startet die Spracherkennung und kehrt zurück, nachdem eine einzelne Äußerung erkannt wurde. Zur Erkennung des Endes einer einzelnen Äußerung wird auf Stille am Ende gelauscht oder gewartet, bis maximal 15 Sekunden an Audiodaten verarbeitet wurden. Die Aufgabe gibt als Ergebnis den Erkennungstext zurück. Hinweis: Da recognizeOnceAsync() nur eine einzelne Äußerung zurückgibt, eignet sie sich nur für die Einzelschusserkennung wie Befehl oder Abfrage. Verwenden Sie stattdessen startContinuousRecognitionAsync() für die Erkennung von mehreren Äußerungen mit langer Ausführungsdauer.
Gibt zurück:
setAuthorizationToken
public void setAuthorizationToken(String token)
Legt das Autorisierungstoken fest, das für die Kommunikation mit dem Dienst verwendet wird. Hinweis: Der Aufrufer muss sicherstellen, dass das Autorisierungstoken gültig ist. Bevor das Autorisierungstoken abläuft, muss der Aufrufer es aktualisieren, indem er diesen Setter mit einem neuen gültigen Token aufruft. Andernfalls treten bei der Erkennung Fehler auf.
Parameter:
startContinuousRecognitionAsync
public Future
Startet die Spracherkennung für einen kontinuierlichen Audiostream, bis stopContinuousRecognitionAsync() aufgerufen wird. Der Benutzer muss Ereignisse abonnieren, um Erkennungsergebnisse zu erhalten.
Gibt zurück:
startKeywordRecognitionAsync
public Future
Konfiguriert die Erkennung mit dem angegebenen Schlüsselwort (keyword)-Modell. Nach dem Aufrufen dieser Methode lauscht die Erkennung auf den Schlüsselwort (keyword), um die Erkennung zu starten. Rufen Sie stopKeywordRecognitionAsync() auf, um die Schlüsselwort (keyword) initiierte Erkennung zu beenden. Der Benutzer muss Ereignisse abonnieren, um Erkennungsergebnisse zu erhalten.
Parameter:
Gibt zurück:
stopContinuousRecognitionAsync
public Future
Beendet einen ausgeführten Erkennungsvorgang so schnell wie möglich und fordert sofort ein Ergebnis basierend auf der Eingabe an, die bisher verarbeitet wurde. Dies funktioniert für alle Erkennungsvorgänge, nicht nur für fortlaufende Vorgänge, und erleichtert die Verwendung von Push-to-Talk- oder "Jetzt beenden"-Schaltflächen für manuelle Audioendpunkte.
Gibt zurück:
stopKeywordRecognitionAsync
public Future
Beendet die Schlüsselwort (keyword) initiierte Erkennung.
Gibt zurück:
Gilt für:
Azure SDK for Java