Delen via


speech Pakket

Microsoft Speech SDK voor Python

Modules

audio

Klassen die betrekking hebben op de verwerking van audio-invoer naar de verschillende herkenningsapparaten en audio-uitvoer van de spraaksynthese.

dialog

Klassen met betrekking tot de dialoogvensterserviceconnector.

enums

Microsoft Speech SDK voor Python

intent

Klassen met betrekking tot intentieherkenning vanuit spraak.

interop

Microsoft Speech SDK voor Python

languageconfig

Klassen die betrekking hebben op de verwerking van taalconfiguraties

properties

Microsoft Speech SDK voor Python

speech

Klassen met betrekking tot het herkennen van tekst uit spraak, het synthetiseren van spraak op basis van tekst en algemene klassen die worden gebruikt in de verschillende recognizers.

transcription

Klassen met betrekking tot gesprektranscriptie.

translation

Klassen met betrekking tot de vertaling van spraak naar andere talen.

version

Microsoft Speech SDK voor Python

Klassen

AudioDataStream

Vertegenwoordigt de audiogegevensstroom die wordt gebruikt om audiogegevens als een stream te gebruiken.

Genereert een audiogegevensstroom van een spraaksyntheseresultaat (type SpeechSynthesisResult) of een resultaat voor trefwoordherkenning (type KeywordRecognitionResult).

AutoDetectSourceLanguageResult

Vertegenwoordigt het resultaat van de brontaal voor automatische detectie.

Het resultaat kan worden geïnitialiseerd op basis van een spraakherkenningsresultaat.

CancellationDetails

Microsoft Speech SDK voor Python

Connection

Proxyklasse voor het beheren van de verbinding met de spraakservice van de opgegeven Recognizer.

Standaard wordt Recognizer de verbinding met de service autonoom beheerd wanneer dat nodig is. De Connection klasse biedt extra methoden voor gebruikers om expliciet een verbinding te openen of te sluiten en zich te abonneren op wijzigingen in de verbindingsstatus. Het gebruik van Connection is optioneel. Het is bedoeld voor scenario's waarin het gedrag van toepassingen op basis van de verbindingsstatus moet worden afgestemd. Gebruikers kunnen desgewenst aanroepen open om handmatig een serviceverbinding te initiëren voordat ze de Recognizer herkenning starten die is gekoppeld aan deze Connection. Na het starten van een herkenning kan het bellen open of close mislukken. Dit heeft geen invloed op de Recognizer of de doorlopende herkenning. De verbinding kan om verschillende redenen worden wegvallen. De Recognizer zal altijd proberen om de verbinding opnieuw in te stellen als dat nodig is om doorlopende bewerkingen te garanderen. In al deze gevallen connected/disconnected geven gebeurtenissen de wijziging van de verbindingsstatus aan.

Notitie

Bijgewerkt in versie 1.17.0.

Constructor voor intern gebruik.

ConnectionEventArgs

Biedt gegevens voor de ConnectionEvent.

Notitie

Toegevoegd in versie 1.2.0

Constructor voor intern gebruik.

EventSignal

Clients kunnen verbinding maken met het gebeurtenissignaal om gebeurtenissen te ontvangen of de verbinding met het gebeurtenissignaal verbreken om het ontvangen van gebeurtenissen te stoppen.

Constructor voor intern gebruik.

KeywordRecognitionEventArgs

Klasse voor gebeurtenisargumenten voor trefwoordherkenning.

Constructor voor intern gebruik.

KeywordRecognitionModel

Vertegenwoordigt een model voor trefwoordherkenning.

KeywordRecognitionResult

Resultaat van een trefwoordherkenningsbewerking.

Constructor voor intern gebruik.

KeywordRecognizer

Een trefwoordherkenning.

NoMatchDetails

Microsoft Speech SDK voor Python

PhraseListGrammar

Klasse waarmee tijdens runtime woordgroephints kunnen worden toegevoegd om spraakherkenning te ondersteunen.

Zinnen die aan de herkenningsfunctie worden toegevoegd, werken aan het begin van de volgende herkenning of de volgende keer dat de spraakherkenning opnieuw verbinding moet maken met de spraakservice.

Notitie

Toegevoegd in versie 1.5.0.

Constructor voor intern gebruik.

PronunciationAssessmentConfig

Vertegenwoordigt configuratie van uitspraakevaluatie

Notitie

Toegevoegd in versie 1.14.0.

De configuratie kan op twee manieren worden geïnitialiseerd:

  • van parameters: geef referentietekst door, beoordelingssysteem, granulariteit, schakel miscue en scenario-id in.

  • uit json: een json-tekenreeks doorgeven

Zie voor de details van de parameters https://docs.microsoft.com/azure/cognitive-services/speech-service/rest-speech-to-text#pronunciation-assessment-parameters

PronunciationAssessmentPhonemeResult

Bevat beoordelingsresultaat voor uitspraak op folaatniveau

Notitie

Toegevoegd in versie 1.14.0.

PronunciationAssessmentResult

Vertegenwoordigt het resultaat van de uitspraakevaluatie.

Notitie

Toegevoegd in versie 1.14.0.

Het resultaat kan worden geïnitialiseerd op basis van een spraakherkenningsresultaat.

PronunciationAssessmentWordResult

Bevat beoordelingsresultaat voor uitspraak op woordniveau

Notitie

Toegevoegd in versie 1.14.0.

PropertyCollection

Klasse voor het ophalen of instellen van een eigenschapswaarde uit een eigenschapsverzameling.

RecognitionEventArgs

Biedt gegevens voor de RecognitionEvent.

Constructor voor intern gebruik.

RecognitionResult

Gedetailleerde informatie over het resultaat van een herkenningsbewerking.

Constructor voor intern gebruik.

Recognizer

Basisklasse voor verschillende recognizers

ResultFuture

Het resultaat van een asynchrone bewerking.

privéconstructor

SessionEventArgs

Basisklasse voor argumenten voor sessiegebeurtenissen.

Constructor voor intern gebruik.

SourceLanguageRecognizer

Een brontaalherkenningsfunctie: zelfstandige taalherkenning, kan worden gebruikt voor één taal of continue taaldetectie.

Notitie

Toegevoegd in versie 1.18.0.

SpeechConfig

Klasse die configuraties definieert voor spraak-/intentieherkenning en spraaksynthese.

De configuratie kan op verschillende manieren worden geïnitialiseerd:

  • van abonnement: geef een abonnementssleutel en een regio door

  • van eindpunt: geef een eindpunt door. Abonnementssleutel of autorisatietoken zijn optioneel.

  • van host: geef een hostadres door. Abonnementssleutel of autorisatietoken zijn optioneel.

  • van autorisatietoken: geef een autorisatietoken en een regio door

SpeechRecognitionCanceledEventArgs

Klasse voor geannuleerde gebeurtenisargumenten voor spraakherkenning.

Constructor voor intern gebruik.

SpeechRecognitionEventArgs

Klasse voor gebeurtenisargumenten voor spraakherkenning.

Constructor voor intern gebruik.

SpeechRecognitionResult

Basisklasse voor spraakherkenningsresultaten.

Constructor voor intern gebruik.

SpeechRecognizer

Een spraakherkenning. Als u brontaalgegevens wilt opgeven, geeft u alleen een van deze drie parameters op: taal, source_language_config of auto_detect_source_language_config.

SpeechSynthesisBookmarkEventArgs

Klasse voor bladwijzerargumenten voor spraaksynthese.

Notitie

Toegevoegd in versie 1.16.0.

Constructor voor intern gebruik.

SpeechSynthesisCancellationDetails

Bevat gedetailleerde informatie over waarom een resultaat is geannuleerd.

SpeechSynthesisEventArgs

Klasse voor gebeurtenisargumenten voor spraaksynthese.

Constructor voor intern gebruik.

SpeechSynthesisResult

Resultaat van een spraaksynthesebewerking.

Constructor voor intern gebruik.

SpeechSynthesisVisemeEventArgs

Klasse voor argumenten voor viseme-gebeurtenis voor spraaksynthese.

Notitie

Toegevoegd in versie 1.16.0.

Constructor voor intern gebruik.

SpeechSynthesisWordBoundaryEventArgs

Klasse voor argumenten voor woordgrens voor spraaksynthese.

Notitie

Bijgewerkt in versie 1.21.0.

Constructor voor intern gebruik.

SpeechSynthesizer

Een spraaksynthesizer.

SyllableLevelTimingResult

Bevat een tijdsinstellingsresultaat voor lettergrepen

Notitie

Toegevoegd in versie 1.20.0.

SynthesisVoicesResult

Bevat gedetailleerde informatie over de opgehaalde synthesestemmenlijst.

Notitie

Toegevoegd in versie 1.16.0.

Constructor voor intern gebruik.

VoiceInfo

Bevat gedetailleerde informatie over de synthese stem informatie.

Notitie

Bijgewerkt in versie 1.17.0.

Constructor voor intern gebruik.

Enums

AudioStreamContainerFormat

Definieert ondersteunde containerindeling voor audiostreams.

AudioStreamWaveFormat

Vertegenwoordigt de indeling die is opgegeven in de WAV-container.

CancellationErrorCode

Definieert de foutcode in het geval dat CancellationReason Fout is.

CancellationReason

Definieert de mogelijke redenen waarom een herkenningsresultaat kan worden geannuleerd.

NoMatchReason

Definieert de mogelijke redenen waarom een herkenningsresultaat mogelijk niet wordt herkend.

OutputFormat

Uitvoerindeling.

ProfanityOption

Verwijdert grof taalgebruik (vloeken) of vervangt letters van grove woorden door sterren.

PronunciationAssessmentGradingSystem

Definieert het puntensysteem voor de kalibratie van de uitspraakscore; de standaardwaarde is FivePoint.

PronunciationAssessmentGranularity

Definieert de granulariteit van de uitspraakevaluatie; de standaardwaarde is Phoneme.

PropertyId

Hiermee definieert u de id's van de spraakeigenschap.

ResultReason

Hiermee geeft u de mogelijke redenen op waarom een herkenningsresultaat kan worden gegenereerd.

ServicePropertyChannel

Definieert kanalen die worden gebruikt om eigenschapsinstellingen door te geven aan service.

SpeechSynthesisOutputFormat

Definieert de mogelijke audio-indelingen voor spraaksynthese-uitvoer.

StreamStatus

Definieert de mogelijke status van de audiogegevensstroom.

SynthesisVoiceGender

Definieert het geslacht van synthesestemmen

SynthesisVoiceType

Definieert het type synthesestemmen