microsoft-cognitiveservices-speech-sdk package

Référence

Classes

ActivityReceivedEventArgs	Définit le contenu des messages/événements reçus.
AudioConfig	Représente la configuration d’entrée audio utilisée pour spécifier le type d’entrée à utiliser (microphone, fichier, flux).
AudioInputStream	Représente le flux d’entrée audio utilisé pour les configurations d’entrée audio personnalisées.
AudioOutputStream	Représente le flux de sortie audio utilisé pour les configurations de sortie audio personnalisées.
AudioStreamFormat	Représente le format de flux audio utilisé pour les configurations d’entrée audio personnalisées.
AutoDetectSourceLanguageConfig	Configuration de la détection automatique de la langue.
AutoDetectSourceLanguageResult	Format de sortie
AvatarConfig	Définit la configuration de l’avatar parlant.
AvatarEventArgs	Définit le contenu pour parler des événements d’avatar.
AvatarSynthesizer	Définit le synthétiseur d’avatar.
AvatarVideoFormat	Définit le format vidéo de sortie de l’avatar.
AvatarWebRTCConnectionResult	Définit le résultat de la connexion WebRTC de l’avatar.
BaseAudioPlayer	TODO de la classe de lecteur audio de base : lit uniquement PCM pour l’instant.
BotFrameworkConfig	Classe qui définit les configurations de l’objet connecteur du service de dialogue pour l’utilisation d’un serveur principal Bot Framework.
CancellationDetails	Contient des informations détaillées sur la raison pour laquelle un résultat a été annulé.
CancellationDetailsBase	Contient des informations détaillées sur la raison pour laquelle un résultat a été annulé.
Connection	Connection est une classe proxy permettant de gérer la connexion au service speech du module Recognizer spécifié. Par défaut, un module Recognizer gère de manière autonome la connexion au service si nécessaire. La classe Connection fournit des méthodes supplémentaires permettant aux utilisateurs d’ouvrir ou de fermer explicitement une connexion et de s’abonner aux modifications de status de connexion. L’utilisation de La connexion est facultative, et principalement pour les scénarios où un réglage précis du comportement de l’application en fonction des status de connexion est nécessaire. Les utilisateurs peuvent éventuellement appeler Open() pour configurer manuellement une connexion à l’avance avant de commencer la reconnaissance sur le module de reconnaissance associé à cette connexion. Si le module Recognizer doit se connecter ou se déconnecter du service, il configure ou arrête la connexion indépendamment. Dans ce cas, la connexion sera avertie par un changement de status de connexion via des événements connectés/déconnectés. Ajouté dans la version 1.2.1.
ConnectionEventArgs	Définit la charge utile pour les événements de connexion tels que Connected/Disconnected. Ajouté dans la version 1.2.0
ConnectionMessage	ConnectionMessage représente les messages spécifiques à l’implémentation envoyés et reçus du service speech. Ces messages sont fournis à des fins de débogage et ne doivent pas être utilisés pour des cas d’usage de production avec le service Speech d’Azure Cognitive Services. Les messages envoyés et reçus par le service Speech sont susceptibles d’être modifiés sans préavis. Cela inclut le contenu des messages, les en-têtes, les charges utiles, le classement, etc. Ajouté dans la version 1.11.0.
ConnectionMessageEventArgs
Conversation
ConversationExpirationEventArgs	Définit le contenu des événements de session tels que SessionStarted/Stopped, SoundStarted/Stopped.
ConversationParticipantsChangedEventArgs	Définit le contenu des événements de session tels que SessionStarted/Stopped, SoundStarted/Stopped.
ConversationTranscriber	Effectue la reconnaissance vocale avec séparation du haut-parleur du microphone, du fichier ou d’autres flux d’entrée audio, et obtient ainsi du texte transcrit.
ConversationTranscriptionCanceledEventArgs	Définit le contenu d’un objet RecognitionErrorEvent.
ConversationTranscriptionEventArgs	Définit le contenu de l’événement de transcription/transcription de conversation.
ConversationTranscriptionResult	Définit le résultat de la transcription de conversation.
ConversationTranslationCanceledEventArgs
ConversationTranslationEventArgs	Définit la charge utile pour les événements de session tels que Speech Start/End Detected
ConversationTranslationResult	Résultat de la traduction de texte.
ConversationTranslator	Rejoignez, quittez ou connectez-vous à une conversation.
Coordinate	Définit une coordonnée dans l’espace 2D.
CustomCommandsConfig	Classe qui définit les configurations de l’objet connecteur de service de dialogue pour l’utilisation d’un serveur principal CustomCommands.
Diagnostics	Définit diagnostics API pour la gestion de la sortie de console Ajoutée dans la version 1.21.0
DialogServiceConfig	Classe qui définit les configurations de base pour le connecteur de service de dialogue
DialogServiceConnector	Connecteur de service de boîte de dialogue
IntentRecognitionCanceledEventArgs	Définissez la charge utile des événements de résultat annulés de reconnaissance d’intention.
IntentRecognitionEventArgs	Arguments d’événement de résultat de la reconnaissance d’intention.
IntentRecognitionResult	Résultat de la reconnaissance d’intention.
IntentRecognizer	Module de reconnaissance d’intention.
KeywordRecognitionModel	Représente un modèle de reconnaissance mot clé permettant de reconnaître quand l’utilisateur indique qu’un mot clé pour lancer une reconnaissance vocale supplémentaire.
LanguageUnderstandingModel	Modèle de compréhension du langage
Meeting
MeetingTranscriber
MeetingTranscriptionCanceledEventArgs	Définit le contenu d’un Objet MeetingTranscriptionCanceledEvent.
MeetingTranscriptionEventArgs	Définit le contenu de l’événement transcrit/transcription de réunion.
NoMatchDetails	Contient des informations détaillées sur les résultats de la reconnaissance NoMatch.
Participant	Représente un participant à une conversation. Ajouté dans la version 1.4.0
PhraseListGrammar	Permet d’ajouter de nouvelles expressions pour améliorer la reconnaissance vocale. Les expressions ajoutées au module de reconnaissance sont effectives au début de la reconnaissance suivante, ou à la prochaine fois que le SpeechSDK doit se reconnecter au service speech.
PronunciationAssessmentConfig	Configuration de l’évaluation de la prononciation.
PronunciationAssessmentResult	Résultats de l’évaluation de prononciation.
PropertyCollection	Représente la collection de propriétés et leurs valeurs.
PullAudioInputStream	Représente le flux d’entrée audio utilisé pour les configurations d’entrée audio personnalisées.
PullAudioInputStreamCallback	Classe de base abstraite qui définit les méthodes de rappel (read() et close()) pour les flux d’entrée audio personnalisés.
PullAudioOutputStream	Représente le flux de sortie audio Push soutenu par la mémoire utilisé pour les configurations de sortie audio personnalisées.
PushAudioInputStream	Représente le flux d’entrée audio Push sauvegardé en mémoire utilisé pour les configurations d’entrée audio personnalisées.
PushAudioOutputStream	Représente le flux de sortie audio utilisé pour les configurations de sortie audio personnalisées.
PushAudioOutputStreamCallback	Classe de base abstraite qui définit les méthodes de rappel (write() et close()) pour les flux de sortie audio personnalisés.
RecognitionEventArgs	Définit la charge utile pour les événements de session tels que Speech Start/End Detected
RecognitionResult	Définit le résultat de la reconnaissance vocale.
Recognizer	Définit la classe de base Recognizer qui contient principalement des gestionnaires d’événements courants.
ServiceEventArgs	Définit la charge utile pour tout événement de message de service ajouté dans la version 1.9.0
SessionEventArgs	Définit le contenu des événements de session tels que SessionStarted/Stopped, SoundStarted/Stopped.
SourceLanguageConfig	Configuration de la langue source.
SpeakerAudioDestination	Représente la destination audio de lecture de l’orateur, qui fonctionne uniquement dans le navigateur. Remarque : le Kit de développement logiciel (SDK) essaiera d’utiliser des extensions de source multimédia pour lire l’audio. Le format Mp3 offre une meilleure prise en charge sur Microsoft Edge, Chrome et Safari (bureau). Il est donc préférable de spécifier le format mp3 pour la lecture.
SpeakerIdentificationModel	Définit la classe SpeakerIdentificationModel pour le modèle de reconnaissance de l’orateur contient un ensemble de profils sur lesquels identifier le ou les haut-parleurs
SpeakerRecognitionCancellationDetails
SpeakerRecognitionResult	Format de sortie
SpeakerRecognizer	Définit la classe SpeakerRecognizer pour les opérations de handles de reconnaissance de l’orateur de l’utilisateur pour les opérations de profil vocal (par exemple, createProfile, deleteProfile)
SpeakerVerificationModel	Définit la classe SpeakerVerificationModel pour le modèle de reconnaissance de l’orateur contient un profil sur lequel vérifier un orateur
SpeechConfig	Configuration vocale.
SpeechConfigImpl
SpeechRecognitionCanceledEventArgs
SpeechRecognitionEventArgs	Définit le contenu de l’événement reconnaissance vocale/reconnu.
SpeechRecognitionResult	Définit le résultat de la reconnaissance vocale.
SpeechRecognizer	Effectue la reconnaissance vocale à partir d’un microphone, d’un fichier ou d’autres flux d’entrée audio, et obtient ainsi du texte transcrit.
SpeechSynthesisBookmarkEventArgs	Définit le contenu de l’événement de signet de synthèse vocale.
SpeechSynthesisEventArgs	Définit le contenu des événements de synthèse vocale.
SpeechSynthesisResult	Définit le résultat de la synthèse vocale.
SpeechSynthesisVisemeEventArgs	Définit le contenu de l’événement de visème de synthèse vocale.
SpeechSynthesisWordBoundaryEventArgs	Définit le contenu de l’événement de limite de mot de synthèse vocale.
SpeechSynthesizer	Définit la classe SpeechSynthesizer pour la synthèse vocale. Mise à jour dans la version 1.16.0
SpeechTranslationConfig	Configuration de la traduction vocale.
SynthesisResult	Classe de base pour les résultats de la synthèse
SynthesisVoicesResult	Définit le résultat de la synthèse vocale.
Synthesizer
TranslationRecognitionCanceledEventArgs	Définissez la charge utile des événements de résultat annulés de reconnaissance vocale.
TranslationRecognitionEventArgs	Arguments d’événement de résultat de texte de traduction.
TranslationRecognitionResult	Résultat de la traduction de texte.
TranslationRecognizer	Module de reconnaissance de traduction
TranslationSynthesisEventArgs	Arguments d’événement de synthèse de traduction
TranslationSynthesisResult	Définit le résultat de la synthèse de traduction, c’est-à-dire la sortie vocale du texte traduit dans la langue cible.
Translations	Représente la collection de paramètres et leurs valeurs.
TurnStatusReceivedEventArgs	Définit le contenu des messages/événements reçus.
User
VoiceInfo	Informations sur la voix de synthèse vocale Ajoutées dans la version 1.20.0.
VoiceProfile	Définit la classe Voice Profile pour la reconnaissance de l’orateur
VoiceProfileCancellationDetails
VoiceProfileClient	Définit la classe VoiceProfileClient pour les opérations de handles de reconnaissance de l’orateur de l’utilisateur pour les opérations de profil vocal (par exemple, createProfile, deleteProfile)
VoiceProfileEnrollmentCancellationDetails
VoiceProfileEnrollmentResult	Format de sortie
VoiceProfilePhraseResult	Format de sortie
VoiceProfileResult	Format de sortie

Interfaces

CancellationEventArgs
ConversationInfo
IParticipant	Représente un participant à une conversation. Ajouté dans la version 1.4.0
IPlayer	Représente l’interface du lecteur audio pour contrôler la lecture audio, comme la pause, la reprise, etc.
IVoiceJson
MeetingInfo
VoiceSignature

Énumérations

AudioFormatTag
CancellationErrorCode	Définit le code d’erreur au cas où CancellationReason est Error. Ajout dans la version 1.1.0.
CancellationReason	Définit les raisons possibles pour lesquelles un résultat de reconnaissance peut être annulé.
LanguageIdMode	Mode d’identification de la langue
LogLevel
NoMatchReason	Définit les raisons possibles pour lesquelles un résultat de reconnaissance peut ne pas être reconnu.
OutputFormat	Définissez les formats de sortie speech Recognizer.
ParticipantChangedReason
ProfanityOption	Option blasphème. Ajouté dans la version 1.7.0.
PronunciationAssessmentGradingSystem	Définit le système de points pour l’étalonnage du score de prononciation ; la valeur par défaut est FivePoint. Ajouté dans la version 1.15.0
PronunciationAssessmentGranularity	Définit la granularité de l’évaluation de la prononciation ; la valeur par défaut est Phonème. Ajouté dans la version 1.15.0
PropertyId	Définit les ID de propriété vocale.
ResultReason	Définit les raisons possibles pour lesquelles un résultat de reconnaissance peut être généré.
ServicePropertyChannel	Définit les canaux utilisés pour passer les paramètres de propriété au service. Ajouté dans la version 1.7.0.
SpeakerRecognitionResultType
SpeechSynthesisBoundaryType	Définit le type de limite de l’événement de limite de synthèse vocale.
SpeechSynthesisOutputFormat	Définissez les formats de sortie audio de synthèse vocale. SpeechSynthesisOutputFormat Mis à jour dans la version 1.17.0
VoiceProfileType	Format de sortie

Partager via

microsoft-cognitiveservices-speech-sdk package

Classes

Interfaces

Énumérations

Ressources supplémentaires