SpeechRecognizer Classe

public final class SpeechRecognizer
extends Recognizer

Effectue la reconnaissance vocale à partir d’un microphone, d’un fichier ou d’autres flux d’entrée audio, et obtient ainsi du texte transcrit. Remarque : close() doit être appelé pour libérer les ressources sous-jacentes détenues par l’objet .

Récapitulatif du champ

Modificateur et type Champ et description
final EventHandlerImpl<SpeechRecognitionCanceledEventArgs> canceled

L’événement annulé indique que la reconnaissance a été annulée.

final EventHandlerImpl<SpeechRecognitionEventArgs> recognized

L’événement reconnu indique qu’un résultat de reconnaissance final est reçu.

final EventHandlerImpl<SpeechRecognitionEventArgs> recognizing

L’événement reconnaissant signale qu’un résultat de reconnaissance intermédiaire est reçu.

Récapitulatif du constructeur

Constructeur Description
SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig)

Initialise une nouvelle instance de Reconnaissance vocale pour la reconnaissance vocale incorporée.

SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)

Initialise une nouvelle instance de Reconnaissance vocale pour la reconnaissance vocale incorporée.

SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)

Initialise une nouvelle instance de Reconnaissance vocale pour la reconnaissance vocale incorporée.

SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AudioConfig audioConfig)

Initialise une nouvelle instance de Reconnaissance vocale pour la reconnaissance vocale incorporée.

SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig)

Initialise une nouvelle instance de Reconnaissance vocale pour la reconnaissance vocale hybride.

SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)

Initialise une nouvelle instance de Reconnaissance vocale pour la reconnaissance vocale hybride.

SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)

Initialise une nouvelle instance de Reconnaissance vocale pour la reconnaissance vocale hybride.

SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AudioConfig audioConfig)

Initialise une nouvelle instance de Reconnaissance vocale pour la reconnaissance vocale hybride.

SpeechRecognizer(SpeechConfig speechConfig)

Initialise une nouvelle instance de Reconnaissance vocale.

SpeechRecognizer(SpeechConfig speechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)

Initialise une nouvelle instance de Reconnaissance vocale.

SpeechRecognizer(SpeechConfig speechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)

Initialise une nouvelle instance de Reconnaissance vocale.

SpeechRecognizer(SpeechConfig speechConfig, SourceLanguageConfig sourceLanguageConfig)

Initialise une nouvelle instance de Reconnaissance vocale.

SpeechRecognizer(SpeechConfig speechConfig, SourceLanguageConfig sourceLanguageConfig, AudioConfig audioConfig)

Initialise une nouvelle instance de Reconnaissance vocale.

SpeechRecognizer(SpeechConfig speechConfig, AudioConfig audioConfig)

Initialise une nouvelle instance de Reconnaissance vocale.

SpeechRecognizer(SpeechConfig speechConfig, String sourceLanguage)

Initialise une nouvelle instance de Reconnaissance vocale.

SpeechRecognizer(SpeechConfig speechConfig, String sourceLanguage, AudioConfig audioConfig)

Initialise une nouvelle instance de Reconnaissance vocale.

Résumé de la méthode

Modificateur et type Méthode et description
protected void dispose(boolean disposing)

Cette méthode effectue le nettoyage des ressources.

java.lang.String getAuthorizationToken()

Obtient le jeton d’autorisation utilisé pour communiquer avec le service.

java.lang.String getEndpointId()

Obtient l’ID de point de terminaison d’un modèle vocal personnalisé utilisé pour la reconnaissance vocale.

OutputFormat getOutputFormat()

Obtient le format de sortie de la reconnaissance.

PropertyCollection getProperties()

Collection de propriétés et leurs valeurs définies pour ce reconnaissancevocale.

java.lang.String getSpeechRecognitionLanguage()

Obtient la langue parlée de reconnaissance.

java.util.concurrent.Future<SpeechRecognitionResult> recognizeOnceAsync()

Démarre la reconnaissance vocale et retourne une fois qu’un seul énoncé est reconnu.

void setAuthorizationToken(String token)

Définit le jeton d’autorisation utilisé pour communiquer avec le service.

java.util.concurrent.Future<java.lang.Void> startContinuousRecognitionAsync()

Démarre la reconnaissance vocale sur un flux audio continu, jusqu’à ce que l’arrêtreconnaissancecontinueAsync() soit appelé.

java.util.concurrent.Future<java.lang.Void> startKeywordRecognitionAsync(KeywordRecognitionModel model)

Configure le module de reconnaissance avec le modèle de mot clé donné.

java.util.concurrent.Future<java.lang.Void> stopContinuousRecognitionAsync()

Arrête une opération de reconnaissance en cours d’exécution dès que possible et demande immédiatement un résultat basé sur l’entrée qui a été traitée jusqu’à présent.

java.util.concurrent.Future<java.lang.Void> stopKeywordRecognitionAsync()

Met fin à la reconnaissance mot clé lancée.

Méthodes héritées de Recognizer

Méthodes héritées de java.lang.Object

java.lang.Object.clone java.lang.Object.equals java.lang.Object.finalize java.lang.Object.getClass java.lang.Object.hashCode java.lang.Object.notify java.lang.Object.notifyAll java.lang.Object.toString java.lang.Object.wait java.lang.Object.wait java.lang.Object.wait

Détails du champ

canceled

public final EventHandlerImpl canceled

L’événement annulé indique que la reconnaissance a été annulée.

recognized

public final EventHandlerImpl recognized

L’événement reconnu indique qu’un résultat de reconnaissance final est reçu.

recognizing

public final EventHandlerImpl recognizing

L’événement reconnaissant signale qu’un résultat de reconnaissance intermédiaire est reçu.

Détails du constructeur

SpeechRecognizer

public SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig)

Initialise une nouvelle instance de Reconnaissance vocale pour la reconnaissance vocale incorporée. Ajouté dans la version 1.19.0

Parameters:

embeddedSpeechConfig - configuration vocale incorporée.

SpeechRecognizer

public SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)

Initialise une nouvelle instance de Reconnaissance vocale pour la reconnaissance vocale incorporée. Ajouté dans la version 1.20.0

Parameters:

embeddedSpeechConfig - configuration vocale incorporée.
autoDetectSourceLangConfig - configuration pour la détection automatique de la langue source.

SpeechRecognizer

public SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)

Initialise une nouvelle instance de Reconnaissance vocale pour la reconnaissance vocale incorporée. Ajouté dans la version 1.20.0

Parameters:

embeddedSpeechConfig - configuration vocale incorporée.
autoDetectSourceLangConfig - configuration pour la détection automatique de la langue source.
audioConfig - configuration audio.

SpeechRecognizer

public SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AudioConfig audioConfig)

Initialise une nouvelle instance de Reconnaissance vocale pour la reconnaissance vocale incorporée. Ajouté dans la version 1.19.0

Parameters:

embeddedSpeechConfig - configuration vocale incorporée.
audioConfig - configuration audio.

SpeechRecognizer

public SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig)

Initialise une nouvelle instance de Reconnaissance vocale pour la reconnaissance vocale hybride.

Parameters:

hybridSpeechConfig - configuration vocale hybride.

SpeechRecognizer

public SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)

Initialise une nouvelle instance de Reconnaissance vocale pour la reconnaissance vocale hybride.

Parameters:

hybridSpeechConfig - configuration vocale hybride.
autoDetectSourceLangConfig - configuration pour la détection automatique de la langue source

SpeechRecognizer

public SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)

Initialise une nouvelle instance de Reconnaissance vocale pour la reconnaissance vocale hybride.

Parameters:

hybridSpeechConfig - configuration vocale hybride.
autoDetectSourceLangConfig - configuration pour la détection automatique de la langue source
audioConfig - configuration audio.

SpeechRecognizer

public SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AudioConfig audioConfig)

Initialise une nouvelle instance de Reconnaissance vocale pour la reconnaissance vocale hybride.

Parameters:

hybridSpeechConfig - configuration vocale hybride.
audioConfig - configuration audio.

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig)

Initialise une nouvelle instance de Reconnaissance vocale.

Parameters:

speechConfig - configuration vocale.

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)

Initialise une nouvelle instance de Reconnaissance vocale.

Parameters:

speechConfig - configuration vocale.
autoDetectSourceLangConfig - configuration pour la détection automatique de la langue source

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)

Initialise une nouvelle instance de Reconnaissance vocale.

Parameters:

speechConfig - configuration vocale.
autoDetectSourceLangConfig - configuration pour la détection automatique de la langue source
audioConfig - configuration audio.

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, SourceLanguageConfig sourceLanguageConfig)

Initialise une nouvelle instance de Reconnaissance vocale.

Parameters:

speechConfig - configuration vocale.
sourceLanguageConfig - configuration de la langue source

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, SourceLanguageConfig sourceLanguageConfig, AudioConfig audioConfig)

Initialise une nouvelle instance de Reconnaissance vocale.

Parameters:

speechConfig - configuration vocale.
sourceLanguageConfig - configuration de la langue source
audioConfig - configuration audio.

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, AudioConfig audioConfig)

Initialise une nouvelle instance de Reconnaissance vocale.

Parameters:

speechConfig - configuration vocale.
audioConfig - configuration audio.

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, String sourceLanguage)

Initialise une nouvelle instance de Reconnaissance vocale.

Parameters:

speechConfig - configuration vocale.
sourceLanguage - langue source de reconnaissance

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, String sourceLanguage, AudioConfig audioConfig)

Initialise une nouvelle instance de Reconnaissance vocale.

Parameters:

speechConfig - configuration vocale.
sourceLanguage - langue source de reconnaissance
audioConfig - configuration audio.

Détails de la méthode

dispose

protected void dispose(boolean disposing)

Cette méthode effectue le nettoyage des ressources. La suppression du paramètre booléen indique si la méthode est appelée à partir de Dispose (si la suppression a la valeur true) ou du finaliseur (si la suppression a la valeur false). Les classes dérivées doivent remplacer cette méthode pour supprimer la ressource si nécessaire.

Overrides:

SpeechRecognizer.dispose(boolean disposing)

Parameters:

disposing

getAuthorizationToken

public String getAuthorizationToken()

Obtient le jeton d’autorisation utilisé pour communiquer avec le service.

Returns:

Jeton d’autorisation,

getEndpointId

public String getEndpointId()

Obtient l’ID de point de terminaison d’un modèle vocal personnalisé utilisé pour la reconnaissance vocale.

Returns:

ID de point de terminaison d’un modèle vocal personnalisé utilisé pour la reconnaissance vocale.

getOutputFormat

public OutputFormat getOutputFormat()

Obtient le format de sortie de la reconnaissance.

Returns:

Format de sortie de la reconnaissance.

getProperties

public PropertyCollection getProperties()

Collection de propriétés et leurs valeurs définies pour ce SpeechRecognizer.

Returns:

Collection de propriétés et leurs valeurs définies pour ce SpeechRecognizer.

getSpeechRecognitionLanguage

public String getSpeechRecognitionLanguage()

Obtient la langue parlée de reconnaissance.

Returns:

Langue parlée de reconnaissance.

recognizeOnceAsync

public Future recognizeOnceAsync()

Démarre la reconnaissance vocale et retourne une fois qu’un seul énoncé est reconnu. La fin d’un énoncé unique est déterminée par la détection du silence à la fin, ou après que 15 secondes d’audio ont été traitées. La tâche retourne le texte de reconnaissance comme résultat. Remarque : étant donné que recognizeOnceAsync() ne retourne qu’un seul énoncé, il convient uniquement pour la reconnaissance d’un seul coup comme une commande ou une requête. Pour la reconnaissance multi-énoncé de longue durée, utilisez à la place startContinuousRecognitionAsync().

Returns:

Tâche représentant l’opération de reconnaissance. La tâche retourne la valeur SpeechRecognitionResult

setAuthorizationToken

public void setAuthorizationToken(String token)

Définit le jeton d’autorisation utilisé pour communiquer avec le service. Remarque : l’appelant doit s’assurer que le jeton d’autorisation est valide. Avant que le jeton d’autorisation expire, l’appelant doit l’actualiser en appelant cet méthode setter avec un nouveau jeton valide. Sinon, le module de reconnaissance rencontrera des erreurs lors de la reconnaissance.

Parameters:

token - Jeton d’autorisation,

startContinuousRecognitionAsync

public Future startContinuousRecognitionAsync()

Démarre la reconnaissance vocale sur un flux audio continu, jusqu’à ce que stopContinuousRecognitionAsync() soit appelé. L’utilisateur doit s’abonner aux événements pour recevoir les résultats de la reconnaissance.

Returns:

Tâche représentant l’opération asynchrone qui démarre la reconnaissance.

startKeywordRecognitionAsync

public Future startKeywordRecognitionAsync(KeywordRecognitionModel model)

Configure le module de reconnaissance avec le modèle de mot clé donné. Après avoir appelé cette méthode, le module de reconnaissance est à l’écoute de la mot clé pour démarrer la reconnaissance. Appelez stopKeywordRecognitionAsync() pour mettre fin à la reconnaissance mot clé lancée. L’utilisateur doit s’abonner aux événements pour recevoir les résultats de la reconnaissance.

Parameters:

model - Le modèle de reconnaissance mot clé qui spécifie les mot clé à reconnaître.

Returns:

Tâche représentant l’opération asynchrone qui démarre la reconnaissance.

stopContinuousRecognitionAsync

public Future stopContinuousRecognitionAsync()

Arrête une opération de reconnaissance en cours d’exécution dès que possible et demande immédiatement un résultat basé sur l’entrée qui a été traitée jusqu’à présent. Cela fonctionne pour toutes les opérations de reconnaissance, pas seulement les opérations continues, et facilite l’utilisation des boutons push-to-talk ou « terminer maintenant » pour les points de terminaison audio manuels.

Returns:

Un avenir qui se terminera une fois le traitement d’entrée arrêté. La génération de résultats, le cas échéant pour l’entrée fournie, peut se produire une fois cette tâche terminée et doit être gérée avec l’événement approprié.

stopKeywordRecognitionAsync

public Future stopKeywordRecognitionAsync()

Met fin à la reconnaissance mot clé lancée.

Returns:

Tâche représentant l’opération asynchrone qui arrête la reconnaissance.

S’applique à