speech Paquet

Référence

Kit de développement logiciel (SDK) Microsoft Speech pour Python

Modules

audio	Classes qui s’occupent de la gestion de l’entrée audio dans les différents modules de reconnaissance et de la sortie audio du synthétiseur vocal.
dialog	Classes liées au connecteur de service de dialogue.
enums	Kit de développement logiciel (SDK) Microsoft Speech pour Python
intent	Classes liées à la reconnaissance d’intention à partir de la parole.
interop	Kit de développement logiciel (SDK) Microsoft Speech pour Python
languageconfig	Classes qui sont concernées par la gestion des configurations de langage
properties	Kit de développement logiciel (SDK) Microsoft Speech pour Python
speech	Classes liées à la reconnaissance vocale, à la synthèse vocale et aux classes générales utilisées dans les différents modules de reconnaissance.
transcription	Classes liées à la transcription de conversation.
translation	Classes liées à la traduction de la parole vers d’autres langues.
version	Kit de développement logiciel (SDK) Microsoft Speech pour Python

Classes

AudioDataStream	Représente le flux de données audio utilisé pour le fonctionnement des données audio en tant que flux. Génère un flux de données audio à partir d’un résultat de synthèse vocale (de type SpeechSynthesisResult) ou d’un résultat de reconnaissance mot clé (type KeywordRecognitionResult).
AutoDetectSourceLanguageResult	Représente le résultat de la langue source de détection automatique. Le résultat peut être initialisé à partir d’un résultat de reconnaissance vocale.
CancellationDetails	Kit de développement logiciel (SDK) Microsoft Speech pour Python
Connection	Classe proxy pour la gestion de la connexion au service speech du spécifié Recognizer. Par défaut, un gestionnaire Recognizer autonome de la connexion au service en cas de besoin. La Connection classe fournit des méthodes supplémentaires permettant aux utilisateurs d’ouvrir ou de fermer explicitement une connexion et de s’abonner aux modifications de status de connexion. L’utilisation de Connection est facultative. Il est destiné aux scénarios dans lesquels un réglage précis du comportement de l’application en fonction des status de connexion est nécessaire. Les utilisateurs peuvent éventuellement appeler open pour lancer manuellement une connexion de service avant de commencer la reconnaissance sur le Recognizer associé à ce Connection. Après avoir démarré une reconnaissance, l’appel open ou close peut échouer. Cela n’aura pas d’impact sur le module de reconnaissance ou la reconnaissance en cours. La connexion peut tomber pour diverses raisons. Le module de reconnaissance tente toujours de rétablir la connexion en fonction des besoins pour garantir les opérations en cours. Dans tous ces casconnected/disconnected, les événements indiquent la modification du status de connexion. Notes Mise à jour dans la version 1.17.0. Constructeur à usage interne.
ConnectionEventArgs	Fournit des données pour l’événement ConnectionEvent. Notes Ajouté dans la version 1.2.0 Constructeur à usage interne.
EventSignal	Les clients peuvent se connecter au signal d’événement pour recevoir des événements, ou se déconnecter du signal d’événement pour arrêter de recevoir des événements. Constructeur à usage interne.
KeywordRecognitionEventArgs	Classe pour mot clé arguments d’événement de reconnaissance. Constructeur à usage interne.
KeywordRecognitionModel	Représente un modèle de reconnaissance mot clé.
KeywordRecognitionResult	Résultat d’une opération de reconnaissance mot clé. Constructeur à usage interne.
KeywordRecognizer	Un module de reconnaissance mot clé.
NoMatchDetails	Kit de développement logiciel (SDK) Microsoft Speech pour Python
PhraseListGrammar	Classe qui permet au runtime d’ajouter des indicateurs d’expression pour faciliter la reconnaissance vocale. Les expressions ajoutées au module de reconnaissance sont effectives au début de la reconnaissance suivante ou à la prochaine fois que le module de reconnaissance vocale doit se reconnecter au service speech. Notes Ajouté dans la version 1.5.0. Constructeur à usage interne.
PronunciationAssessmentConfig	Représente la configuration de l’évaluation de la prononciation Notes Ajouté dans la version 1.14.0. La configuration peut être initialisée de deux manières : à partir des paramètres : passez le texte de référence, le système de notation, la granularité, l’activation d’erreur et l’ID de scénario. à partir de json : passer une chaîne json Pour plus d’informations sur les paramètres, consultez https://docs.microsoft.com/azure/cognitive-services/speech-service/rest-speech-to-text#pronunciation-assessment-parameters
PronunciationAssessmentPhonemeResult	Contient le résultat de l’évaluation de la prononciation au niveau du phonème Notes Ajouté dans la version 1.14.0.
PronunciationAssessmentResult	Représente le résultat de l’évaluation de la prononciation. Notes Ajouté dans la version 1.14.0. Le résultat peut être initialisé à partir d’un résultat de reconnaissance vocale.
PronunciationAssessmentWordResult	Contient le résultat de l’évaluation de la prononciation au niveau du mot Notes Ajouté dans la version 1.14.0.
PropertyCollection	Classe pour récupérer ou définir une valeur de propriété à partir d’une collection de propriétés.
RecognitionEventArgs	Fournit des données pour l’événement RecognitionEvent. Constructeur à usage interne.
RecognitionResult	Informations détaillées sur le résultat d’une opération de reconnaissance. Constructeur à usage interne.
Recognizer	Classe de base pour différents modules de reconnaissance
ResultFuture	Résultat d'une opération asynchrone. constructeur privé
SessionEventArgs	Classe de base pour les arguments d’événement de session. Constructeur à usage interne.
SourceLanguageRecognizer	Un module de reconnaissance de langue source ( module de reconnaissance de langue autonome) peut être utilisé pour la détection de langue unique ou continue. Notes Ajouté dans la version 1.18.0.
SpeechConfig	Classe qui définit les configurations pour la reconnaissance vocale/intention et la synthèse vocale. La configuration peut être initialisée de différentes manières : à partir de l’abonnement : passer une clé d’abonnement et une région à partir du point de terminaison : passez un point de terminaison. La clé d’abonnement ou le jeton d’autorisation sont facultatifs. de l’hôte : transmettez une adresse d’hôte. La clé d’abonnement ou le jeton d’autorisation sont facultatifs. à partir du jeton d’autorisation : passez un jeton d’autorisation et une région
SpeechRecognitionCanceledEventArgs	Classe pour les arguments d’événement annulés de reconnaissance vocale. Constructeur à usage interne.
SpeechRecognitionEventArgs	Classe pour les arguments d’événement de reconnaissance vocale. Constructeur à usage interne.
SpeechRecognitionResult	Classe de base pour les résultats de la reconnaissance vocale. Constructeur à usage interne.
SpeechRecognizer	Un module de reconnaissance vocale. Si vous devez spécifier des informations sur la langue source, spécifiez uniquement l’un de ces trois paramètres, language, source_language_config ou auto_detect_source_language_config.
SpeechSynthesisBookmarkEventArgs	Classe pour les arguments d’événement de signet de synthèse vocale. Notes Ajout dans la version 1.16.0. Constructeur pour une utilisation interne.
SpeechSynthesisCancellationDetails	Contient des informations détaillées sur la raison pour laquelle un résultat a été annulé.
SpeechSynthesisEventArgs	Classe pour les arguments d’événement de synthèse vocale. Constructeur pour une utilisation interne.
SpeechSynthesisResult	Résultat d’une opération de synthèse vocale. Constructeur pour une utilisation interne.
SpeechSynthesisVisemeEventArgs	Classe pour les arguments d’événement de visème de synthèse vocale. Notes Ajout dans la version 1.16.0. Constructeur pour une utilisation interne.
SpeechSynthesisWordBoundaryEventArgs	Classe pour les arguments d’événement de limite de mot de synthèse vocale. Notes Mise à jour dans la version 1.21.0. Constructeur pour une utilisation interne.
SpeechSynthesizer	Synthétiseur vocal.
SyllableLevelTimingResult	Contient le résultat du minutage de niveau syllabe Notes Ajout dans la version 1.20.0.
SynthesisVoicesResult	Contient des informations détaillées sur la liste des voix de synthèse récupérées. Notes Ajout dans la version 1.16.0. Constructeur pour une utilisation interne.
VoiceInfo	Contient des informations détaillées sur les informations vocales de synthèse. Notes Mise à jour dans la version 1.17.0. Constructeur pour une utilisation interne.

Énumérations

AudioStreamContainerFormat	Définit le format de conteneur de flux audio pris en charge.
AudioStreamWaveFormat	Représente le format spécifié dans le conteneur WAV.
CancellationErrorCode	Définit le code d’erreur au cas où CancellationReason est Error.
CancellationReason	Définit les raisons possibles pour lesquelles un résultat de reconnaissance peut être annulé.
NoMatchReason	Définit les raisons possibles pour lesquelles un résultat de reconnaissance peut ne pas être reconnu.
OutputFormat	Format de sortie.
ProfanityOption	Supprime les blasphèmes (jurons) ou remplace les lettres de mots profanes par des étoiles.
PronunciationAssessmentGradingSystem	Définit le système de points pour l’étalonnage du score de prononciation ; la valeur par défaut est FivePoint.
PronunciationAssessmentGranularity	Définit la granularité de l’évaluation de la prononciation ; la valeur par défaut est Phonème.
PropertyId	Définit les ID de propriété vocale.
ResultReason	Spécifie les raisons possibles pour lesquelles un résultat de reconnaissance peut être généré.
ServicePropertyChannel	Définit les canaux utilisés pour passer les paramètres de propriété au service.
SpeechSynthesisOutputFormat	Définit les formats audio de sortie de synthèse vocale possibles.
StreamStatus	Définit les status possibles du flux de données audio.
SynthesisVoiceGender	Définit le sexe des voix de synthèse
SynthesisVoiceType	Définit le type de voix de synthèse

Partager via

speech Paquet

Modules

Classes

Énumérations

Ressources supplémentaires