microsoft-cognitiveservices-speech-sdk package

Klassen

ActivityReceivedEventArgs

Hiermee definieert u de inhoud van ontvangen berichten/gebeurtenissen.

AudioConfig

Vertegenwoordigt de audio-invoerconfiguratie die wordt gebruikt om op te geven welk type invoer moet worden gebruikt (microfoon, bestand, stream).

AudioInputStream

Vertegenwoordigt de audio-invoerstroom die wordt gebruikt voor aangepaste configuraties voor audio-invoer.

AudioOutputStream

Vertegenwoordigt de audio-uitvoerstroom die wordt gebruikt voor aangepaste configuraties voor audio-uitvoer.

AudioStreamFormat

Vertegenwoordigt de audiostreamindeling die wordt gebruikt voor aangepaste configuraties voor audio-invoer.

AutoDetectSourceLanguageConfig

Configuratie voor automatische taaldetectie.

AutoDetectSourceLanguageResult

Uitvoerindeling

AvatarConfig

Hiermee definieert u de configuratie van de pratende avatar.

AvatarEventArgs

Definieert inhoud voor sprekende avatar-gebeurtenissen.

AvatarSynthesizer

Definieert de avatarsynthesizer.

AvatarVideoFormat

Definieert de video-indeling voor avataruitvoer.

AvatarWebRTCConnectionResult

Definieert het resultaat van de avatar WebRTC-verbinding.

BaseAudioPlayer

Todo voor basisaudiospelerklasse: speelt voorlopig alleen PCM af.

BotFrameworkConfig

Klasse die configuraties definieert voor het dialoogvensterserviceconnectorobject voor het gebruik van een Bot Framework-back-end.

CancellationDetails

Bevat gedetailleerde informatie over waarom een resultaat is geannuleerd.

CancellationDetailsBase

Bevat gedetailleerde informatie over waarom een resultaat is geannuleerd.

Connection

Verbinding is een proxyklasse voor het beheren van de verbinding met de spraakservice van de opgegeven Recognizer. Standaard beheert een Recognizer de verbinding met de service autonoom wanneer dat nodig is. De klasse Verbinding biedt gebruikers aanvullende methoden om expliciet een verbinding te openen of te sluiten en zich te abonneren op wijzigingen in de verbindingsstatus. Het gebruik van Verbinding is optioneel en vooral voor scenario's waarin het gedrag van de toepassing op basis van de verbindingsstatus moet worden afgestemd. Gebruikers kunnen optioneel Open() aanroepen om handmatig een verbinding in te stellen voordat ze de herkenning starten op de Recognizer die aan deze verbinding is gekoppeld. Als de Recognizer verbinding moet maken of de verbinding met de service moet verbreken, wordt de verbinding onafhankelijk ingesteld of afgesloten. In dit geval wordt de verbinding op de hoogte gesteld door wijziging van de verbindingsstatus via verbonden/verbroken gebeurtenissen. Toegevoegd in versie 1.2.1.

ConnectionEventArgs

Definieert nettolading voor verbindingsgebeurtenissen zoals Verbonden/Verbroken. Toegevoegd in versie 1.2.0

ConnectionMessage

ConnectionMessage vertegenwoordigt implementatiespecifieke berichten die zijn verzonden naar en ontvangen van de spraakservice. Deze berichten worden verstrekt voor foutopsporingsdoeleinden en mogen niet worden gebruikt voor productiegebruiksvoorbeelden met de Azure Cognitive Services Speech Service. Berichten die worden verzonden naar en ontvangen van de Speech Service kunnen zonder kennisgeving worden gewijzigd. Dit omvat berichtinhoud, kopteksten, nettoladingen, volgorde, enzovoort. Toegevoegd in versie 1.11.0.

ConnectionMessageEventArgs
Conversation
ConversationExpirationEventArgs

Definieert inhoud voor sessiegebeurtenissen zoals SessionStarted/Stopped, SoundStarted/Stopped.

ConversationParticipantsChangedEventArgs

Definieert inhoud voor sessiegebeurtenissen zoals SessionStarted/Stopped, SoundStarted/Stopped.

ConversationTranscriber

Voert spraakherkenning uit met sprekerscheiding van microfoon, bestand of andere audio-invoerstromen en krijgt getranscribeerde tekst als resultaat.

ConversationTranscriptionCanceledEventArgs

Hiermee definieert u de inhoud van een RecognitionErrorEvent.

ConversationTranscriptionEventArgs

Hiermee definieert u de inhoud van de getranscribeerde/transscribeergebeurtenis van een gesprek.

ConversationTranscriptionResult

Definieert het resultaat van gesprektranscriptie.

ConversationTranslationCanceledEventArgs
ConversationTranslationEventArgs

Definieert de nettolading voor sessie-gebeurtenissen zoals spraakstart/-einde gedetecteerd

ConversationTranslationResult

Resultaat van vertaaltekst.

ConversationTranslator

Neem deel aan een gesprek, verlaat of maak verbinding met een gesprek.

Coordinate

Definieert een coördinaat in 2D-ruimte.

CustomCommandsConfig

Klasse die configuraties definieert voor het dialoogvensterserviceconnectorobject voor het gebruik van een CustomCommands-back-end.

Diagnostics

Definieert diagnostische API voor het beheren van console-uitvoer Toegevoegd in versie 1.21.0

DialogServiceConfig

Klasse die basisconfiguraties definieert voor de connector voor de dialoogvensterservice

DialogServiceConnector

Dialoogvenster Serviceconnector

IntentRecognitionCanceledEventArgs

Definieer de nettolading van geannuleerde resultaatgebeurtenissen voor intentieherkenning.

IntentRecognitionEventArgs

Resultaat van gebeurtenisargumenten voor intentieherkenning.

IntentRecognitionResult

Resultaat van intentieherkenning.

IntentRecognizer

Intentieherkenning.

KeywordRecognitionModel

Vertegenwoordigt een model voor trefwoordherkenning om te herkennen wanneer de gebruiker een trefwoord zegt om verdere spraakherkenning te initiëren.

LanguageUnderstandingModel

Language Understanding-model

Meeting
MeetingTranscriber
MeetingTranscriptionCanceledEventArgs

Hiermee definieert u de inhoud van een MeetingTranscriptionCanceledEvent.

MeetingTranscriptionEventArgs

Definieert de inhoud van de getranscribeerde/transscribeerde gebeurtenis van de vergadering.

NoMatchDetails

Bevat gedetailleerde informatie voor NoMatch-herkenningsresultaten.

Participant

Vertegenwoordigt een deelnemer aan een gesprek. Toegevoegd in versie 1.4.0

PhraseListGrammar

Hiermee kunt u nieuwe zinnen toevoegen om spraakherkenning te verbeteren.

Zinnen die aan de herkenningsfunctie worden toegevoegd, werken aan het begin van de volgende herkenning of de volgende keer dat de SpeechSDK opnieuw verbinding moet maken met de spraakservice.

PronunciationAssessmentConfig

Configuratie van uitspraakevaluatie.

PronunciationAssessmentResult

Resultaten van uitspraakevaluatie.

PropertyCollection

Vertegenwoordigt een verzameling eigenschappen en hun waarden.

PullAudioInputStream

Vertegenwoordigt de audio-invoerstroom die wordt gebruikt voor aangepaste configuraties voor audio-invoer.

PullAudioInputStreamCallback

Een abstracte basisklasse die callback-methoden (read() en close()) voor aangepaste audio-invoerstromen definieert.

PullAudioOutputStream

Vertegenwoordigt de push-audio-uitvoerstroom met ondersteuning van het geheugen die wordt gebruikt voor aangepaste configuraties voor audio-uitvoer.

PushAudioInputStream

Vertegenwoordigt de push-audio-invoerstroom met geheugensteun die wordt gebruikt voor aangepaste configuraties voor audio-invoer.

PushAudioOutputStream

Vertegenwoordigt de audio-uitvoerstroom die wordt gebruikt voor aangepaste configuraties voor audio-uitvoer.

PushAudioOutputStreamCallback

Een abstracte basisklasse die callbackmethoden (write() en close()) voor aangepaste audio-uitvoerstromen definieert.

RecognitionEventArgs

Definieert de nettolading voor sessie-gebeurtenissen zoals spraakstart/-einde gedetecteerd

RecognitionResult

Definieert het resultaat van spraakherkenning.

Recognizer

Definieert de basisklasse Recognizer die voornamelijk algemene gebeurtenis-handlers bevat.

ServiceEventArgs

Definieert de nettolading voor elke servicebericht-gebeurtenis die is toegevoegd in versie 1.9.0

SessionEventArgs

Definieert inhoud voor sessiegebeurtenissen zoals SessionStarted/Stopped, SoundStarted/Stopped.

SourceLanguageConfig

Configuratie van brontaal.

SpeakerAudioDestination

Vertegenwoordigt de audiobestemming voor het afspelen van de luidspreker, die alleen werkt in de browser. Opmerking: de SDK probeert mediabronextensies te gebruiken om audio af te spelen. Mp3-indeling heeft betere ondersteuning voor Microsoft Edge, Chrome en Safari (desktop), dus het is beter om de mp3-indeling op te geven voor afspelen.

SpeakerIdentificationModel

De klasse SpeakerIdentificationModel voor het Speaker Recognition-model bevat een set profielen aan de hand waarvan spreker(s) kan worden geïdentificeerd

SpeakerRecognitionCancellationDetails
SpeakerRecognitionResult

Uitvoerindeling

SpeakerRecognizer

Definieert de klasse SpeakerRecognizer voor bewerkingen van sprekerherkenningshandgrepen van de gebruiker voor spraakprofielbewerkingen (bijvoorbeeld createProfile, deleteProfile)

SpeakerVerificationModel

Definieert de Klasse SpeakerVerificationModel voor Speaker Recognition Model bevat een profiel op basis waarvan een spreker kan worden geverifieerd

SpeechConfig

Spraakconfiguratie.

SpeechConfigImpl
SpeechRecognitionCanceledEventArgs
SpeechRecognitionEventArgs

Definieert de inhoud van spraakherkennings-/herkende gebeurtenis.

SpeechRecognitionResult

Definieert het resultaat van spraakherkenning.

SpeechRecognizer

Voert spraakherkenning uit van microfoon, bestands- of andere audio-invoerstromen en krijgt getranscribeerde tekst als resultaat.

SpeechSynthesisBookmarkEventArgs

Hiermee definieert u de inhoud van de bladwijzer-gebeurtenis voor spraaksynthese.

SpeechSynthesisEventArgs

Hiermee definieert u de inhoud van spraaksynthese-gebeurtenissen.

SpeechSynthesisResult

Definieert het resultaat van spraaksynthese.

SpeechSynthesisVisemeEventArgs

Definieert de inhoud van de viseme-gebeurtenis voor spraaksynthese.

SpeechSynthesisWordBoundaryEventArgs

Hiermee definieert u de inhoud van de woordgrens voor spraaksynthese.

SpeechSynthesizer

Definieert de klasse SpeechSynthesizer voor tekst-naar-spraak. Bijgewerkt in versie 1.16.0

SpeechTranslationConfig

Configuratie van spraakomzetting.

SynthesisResult

Basisklasse voor syntheseresultaten

SynthesisVoicesResult

Definieert het resultaat van spraaksynthese.

Synthesizer
TranslationRecognitionCanceledEventArgs

Definieer de nettolading van geannuleerde resultaatgebeurtenissen voor spraakherkenning.

TranslationRecognitionEventArgs

Resultaat van resultaatargumenten voor vertalingstekst.

TranslationRecognitionResult

Resultaat van vertaaltekst.

TranslationRecognizer

Vertaalherkenning

TranslationSynthesisEventArgs

Argumenten voor omzettingssynthese-gebeurtenis

TranslationSynthesisResult

Definieert het resultaat van de omzettingssynthese, d.w.w.w. de spraakuitvoer van de vertaalde tekst in de doeltaal.

Translations

Vertegenwoordigt een verzameling parameters en hun waarden.

TurnStatusReceivedEventArgs

Hiermee definieert u de inhoud van ontvangen berichten/gebeurtenissen.

User
VoiceInfo

Informatie over spraaksynthesestem toegevoegd in versie 1.20.0.

VoiceProfile

Definieert de klasse Spraakprofiel voor Sprekerherkenning

VoiceProfileCancellationDetails
VoiceProfileClient

Definieert de klasse VoiceProfileClient voor bewerkingen van de sprekerherkenningshandgrepen van de gebruiker voor spraakprofielbewerkingen (bijvoorbeeld createProfile, deleteProfile)

VoiceProfileEnrollmentCancellationDetails
VoiceProfileEnrollmentResult

Uitvoerindeling

VoiceProfilePhraseResult

Uitvoerindeling

VoiceProfileResult

Uitvoerindeling

Interfaces

CancellationEventArgs
ConversationInfo
IParticipant

Vertegenwoordigt een deelnemer aan een gesprek. Toegevoegd in versie 1.4.0

IPlayer

Vertegenwoordigt de interface van de audiospeler om het afspelen van audio te regelen, zoals onderbreken, hervatten, enzovoort.

MeetingInfo
VoiceSignature

Enums

AudioFormatTag
CancellationErrorCode

Definieert de foutcode in het geval dat CancellationReason Fout is. Toegevoegd in versie 1.1.0.

CancellationReason

Definieert de mogelijke redenen waarom een herkenningsresultaat kan worden geannuleerd.

LanguageIdMode

Taalidentificatiemodus

LogLevel
NoMatchReason

Definieert de mogelijke redenen waarom een herkenningsresultaat mogelijk niet wordt herkend.

OutputFormat

Definieer de uitvoerindelingen van Speech Recognizer.

ParticipantChangedReason
ProfanityOption

Optie voor scheldwoorden. Toegevoegd in versie 1.7.0.

PronunciationAssessmentGradingSystem

Definieert het puntensysteem voor de kalibratie van de uitspraakscore; de standaardwaarde is FivePoint. Toegevoegd in versie 1.15.0

PronunciationAssessmentGranularity

Definieert de granulariteit van de uitspraakevaluatie; de standaardwaarde is Phoneme. Toegevoegd in versie 1.15.0

PropertyId

Hiermee definieert u de id's van de spraakeigenschap.

ResultReason

Definieert de mogelijke redenen waarom een herkenningsresultaat kan worden gegenereerd.

ServicePropertyChannel

Definieert kanalen die worden gebruikt om eigenschapsinstellingen door te geven aan service. Toegevoegd in versie 1.7.0.

SpeakerRecognitionResultType
SpeechSynthesisBoundaryType

Hiermee definieert u het grenstype van de grens voor spraaksynthese.

SpeechSynthesisOutputFormat

Audio-uitvoerindelingen voor spraaksynthese definiëren. SpeechSynthesisOutputFormat Bijgewerkt in versie 1.17.0

VoiceProfileType

Uitvoerindeling