Sdílet prostřednictvím


Obor názvů Microsoft::CognitiveServices::Speech

Souhrn

Členové Popisy
enum PropertyId Definuje ID vlastností řeči. Změna ve verzi 1.4.0.
enum OutputFormat Formát výstupu.
enum ProfanityOption Odstraní vulgární výrazy (nadávky) nebo nahradí písmena vulgárních slov hvězdičkami. Přidáno ve verzi 1.5.0.
enum ResultReason Určuje možné důvody, proč se může vygenerovat výsledek rozpoznávání.
enum CancellationReason Definuje možné příčiny zrušení výsledku rozpoznávání.
enum CancellationErrorCode Definuje kód chyby v případě, že CancellationReason je Error. Přidáno ve verzi 1.1.0.
enum NoMatchReason Definuje možné důvody, proč nemusí být rozpoznán výsledek rozpoznávání.
výčet ActivityJSONType Definuje možné typy pro hodnotu JSON aktivity. Přidáno ve verzi 1.5.0.
enum SpeechSynthesisOutputFormat Definuje možné formáty výstupu výstupu syntézy řeči. Aktualizováno ve verzi 1.19.0.
enum StreamStatus Definuje možný stav zvukového datového proudu. Přidáno ve verzi 1.4.0.
enum ServicePropertyChannel Definuje kanály používané k předávání nastavení vlastností službě. Přidáno ve verzi 1.5.0.
enum VoiceProfileType Definuje typy hlasových profilů.
výčet RecognitionFactorScope Definuje obor, na který se vztahuje faktor rozpoznávání.
enum Pronu výslovnostAssessmentGradingSystem Definuje bodový systém pro kalibraci skóre výslovnosti; Výchozí hodnota je FivePoint. Přidáno ve verzi 1.14.0.
enum VýslovnostAssessmentGranularity Definuje členitost vyhodnocení výslovnosti; výchozí hodnota je Phoneme. Přidáno ve verzi 1.14.0.
enum SynthesisVoiceType Definuje typ syntézy hlasů přidaných ve verzi 1.16.0.
enum SynthesisVoiceGender Definuje pohlaví syntézy hlasů přidaných ve verzi 1.17.0.
výčet SpeechSynthesisBoundaryType Definuje typ hranice hraniční události syntézy řeči přidané ve verzi 1.21.0.
AsyncRecognizer třídy AsyncRecognizer abstraktní základní třída.
třída AudioDataStream Představuje zvukový datový proud používaný pro provoz zvukových dat jako datového proudu. Přidáno ve verzi 1.4.0.
třída AutoDetectSourceLanguageConfig Třída, která definuje konfiguraci zdroje automatického zjišťování aktualizovanou ve verzi 1.13.0.
třída AutoDetectSourceLanguageResult Obsahuje automaticky rozpoznaný výsledek zdrojového jazyka Přidaný ve 1.8.0.
Třída BaseAsyncRecognizer BaseAsyncRecognizer – třída
CancellationDetails třídy Obsahuje podrobné informace o tom, proč byl výsledek zrušen.
ClassLanguageModel třídy Představuje seznam gramatiky pro scénáře dynamické gramatiky. Přidáno ve verzi 1.7.0.
připojení třídy Připojení je třída proxy pro správu připojení k řečové službě zadaného rozpoznávání. Rozpoznávání ve výchozím nastavení v případě potřeby samostatně spravuje připojení ke službě. Třída Connection poskytuje uživatelům další metody explicitně otevřít nebo zavřít připojení a přihlásit se k odběru změn stavu připojení. Připojení je volitelné. Je určená pro scénáře, kdy je potřeba jemně doladit chování aplikace na základě stavu připojení. Uživatelé můžou volitelně zavolat Open() a ručně zahájit připojení služby před zahájením rozpoznávání v rozpoznávání přidruženém k tomuto připojení. Po spuštění rozpoznávání může volání Open() nebo Close() selhat. To nebude mít vliv na rozpoznávání ani probíhající rozpoznávání. Připojení může z různých důvodů vypadnout. Rozpoznávání se vždy pokusí znovu vytvořit připojení podle potřeby, aby se zajistily průběžné operace. Ve všech těchto případech události Připojeno/Odpojeno značí změnu stavu připojení. Aktualizováno ve verzi 1.17.0.
Třída ConnectionEventArgs Poskytuje data pro ConnectionEvent. Přidáno ve verzi 1.2.0.
Třída ConnectionMessage ConnectionMessage představuje zprávy specifické pro implementaci odesílané a přijaté z hlasové služby. Tyto zprávy jsou poskytovány pro účely ladění a neměly by se používat v produkčních případech použití se službou Azure Cognitive Services Speech Service. Zprávy odeslané do služby Speech a přijaté ze služby Speech se můžou změnit bez předchozího upozornění. To zahrnuje obsah zpráv, záhlaví, datové části, řazení atd. Přidáno ve verzi 1.10.0.
Třída ConnectionMessageEventArgs Poskytuje data pro ConnectionMessageEvent.
třída EmbeddedSpeechConfig Třída, která definuje vloženou (offline) konfiguraci řeči.
Třída EventArgs Základní třída pro argumenty událostí.
Třída EventSignal Klienti se můžou připojit ke signálu událostí, aby mohli přijímat události, nebo se odpojit od signálu událostí, aby zastavili příjem událostí.
Třída EventSignalBase Klienti se můžou připojit ke signálu událostí, aby mohli přijímat události, nebo se odpojit od signálu událostí, aby zastavili příjem událostí.
class Grammar Představuje gramatiku základní třídy pro přizpůsobení rozpoznávání řeči. Přidáno ve verzi 1.5.0.
GrammarList třídy Představuje seznam gramatiky pro scénáře dynamické gramatiky. Přidáno ve verzi 1.7.0.
GrammarPhrase třídy Představuje frázi, kterou může uživatel vyslovit. Přidáno ve verzi 1.5.0.
Třída HybridSpeechConfig Třída, která definuje hybridní (cloudové a vložené) konfigurace pro rozpoznávání řeči nebo syntézu řeči.
třída KeywordRecognitionEventArgs Třída událostí vynechaných KeywordRecognizer.
třída KeywordRecognitionModel Představuje model rozpoznávání klíčových slov používaný s metodami StartKeywordRecognitionAsync.
třída KeywordRecognitionResult Třída, která definuje výsledky generované KeywordRecognizer.
Třída KeywordRecognizer Typ rozpoznávání, který je specializovaný pouze na zpracování aktivace klíčových slov.
třída NoMatchDetails Obsahuje podrobné informace o výsledcích rozpoznávání NoMatch.
třída PhraseListGrammar Představuje gramatiku seznamu frází pro scénáře dynamické gramatiky. Přidáno ve verzi 1.5.0.
Class Pronu výslovnostAssessmentConfig Třída, která definuje konfiguraci posouzení výslovnosti přidanou ve verzi 1.14.0.
Class Pronu výslovnostAssessmentResult Třída pro výsledky vyhodnocení výslovnosti
Class Pronu výslovnostContentAssessmentResult Třída pro výsledky posouzení obsahu
Třída PropertyCollection Třída pro načtení nebo nastavení hodnoty vlastnosti z kolekce vlastností.
RecognitionEventArgs třídy Poskytuje data pro RecognitionEvent.
RecognitionResult třídy Obsahuje podrobné informace o výsledku operace rozpoznávání.
rozpoznávání tříd Základní třída rozpoznávání.
třída SessionEventArgs Základní třída pro argumenty událostí relace.
třída SmartHandle Třída inteligentních úchytů
třída SourceLanguageConfig Třída, která definuje konfiguraci zdrojového jazyka přidanou ve 1.8.0.
třída SourceLanguageRecognizer Třída pro rozpoznávání zdrojového jazyka Tuto třídu můžete použít k rozpoznávání samostatného jazyka. Přidáno ve verzi 1.17.0.
SpeechConfig třídy Třída, která definuje konfigurace rozpoznávání řeči / záměru nebo syntézy řeči.
třída SpeechRecognitionCanceledEventArgs Třída pro argumenty události zrušení rozpoznávání řeči
třída SpeechRecognitionEventArgs Třída pro argumenty události rozpoznávání řeči
třída SpeechRecognitionModel Informace o modelu rozpoznávání řeči
třída SpeechRecognitionResult Základní třída pro výsledky rozpoznávání řeči.
Třída SpeechRecognizer Třída pro rozpoznávání řeči
třída SpeechSynthesisBookmarkEventArgs Třída pro syntézu řeči záložky argumenty události. Přidáno ve verzi 1.16.0.
třída SpeechSynthesisCancellationDetails Obsahuje podrobné informace o tom, proč byl výsledek zrušen. Přidáno ve verzi 1.4.0.
třída SpeechSynthesisEventArgs Třída pro argumenty události syntézy řeči Přidáno ve verzi 1.4.0.
třída SpeechSynthesisResult Obsahuje informace o výsledku syntézy textu na řeč. Přidáno ve verzi 1.4.0.
třída SpeechSynthesisVisemeEventArgs Třída pro argumenty události viseme syntézy řeči Přidáno ve verzi 1.16.0.
třída SpeechSynthesisWordBoundaryEventArgs Třída pro argumenty události hranice slova syntézy řeči Přidáno ve verzi 1.7.0.
Třída SpeechSynthesizer Třída syntetizátoru řeči Aktualizováno ve verzi 1.14.0.
třída SpeechTranslationModel Informace o modelu překladu řeči
třída SynthesisVoicesResult Obsahuje informace o výsledcích ze seznamu hlasů syntetizátorů řeči. Přidáno ve verzi 1.16.0.
VoiceInfo třídy Obsahuje informace o syntéze hlasových informací aktualizované ve verzi 1.17.0.

Členové

enum PropertyId

Hodnoty Popisy
SpeechServiceConnection_Key Klíč předplatného služby Cognitive Services Speech. Pokud používáte rozpoznávání záměrů, musíte zadat klíč koncového bodu LUIS pro vaši konkrétní aplikaci LUIS. Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte SpeechConfig::FromSubscription.
SpeechServiceConnection_Endpoint Koncový bod služby Cognitive Services Speech Service (adresa URL). Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte SpeechConfig::FromEndpoint. POZNÁMKA: Tento koncový bod není stejný jako koncový bod použitý k získání přístupového tokenu.
SpeechServiceConnection_Region Oblast služby Cognitive Services Speech. Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte SpeechConfig::FromSubscription, SpeechConfig::FromEndpoint, SpeechConfig::FromHost, SpeechConfig::FromAuthorizationToken.
SpeechServiceAuthorization_Token Autorizační token služby Cognitive Services Speech Service (neboli přístupový token) Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte SpeechConfig::FromAuthorizationToken, SpeechRecognizer::SetAuthorizationToken, IntentRecognizer::SetAuthorizationToken, TranslationRecognizer::SetAuthorizationToken.
SpeechServiceAuthorization_Type Typ autorizace služby Cognitive Services Speech Service Aktuálně se nepoužívá.
SpeechServiceConnection_EndpointId ID koncového bodu služby Cognitive Services Custom Speech nebo Custom Voice Service Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte SpeechConfig::SetEndpointId. POZNÁMKA: ID koncového bodu je k dispozici na portálu Custom Speech uvedené v části Podrobnosti o koncovém bodu.
SpeechServiceConnection_Host Hostitel služby Cognitive Services Speech Service (adresa URL). Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte SpeechConfig::FromHost.
SpeechServiceConnection_ProxyHostName Název hostitele proxy serveru použitého pro připojení ke službě Cognitive Services Speech. Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte SpeechConfig::SetProxy. POZNÁMKA: Toto ID vlastnosti bylo přidáno ve verzi 1.1.0.
SpeechServiceConnection_ProxyPort Port proxy serveru, který se používá pro připojení ke službě Cognitive Services Speech. Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte SpeechConfig::SetProxy. POZNÁMKA: Toto ID vlastnosti bylo přidáno ve verzi 1.1.0.
SpeechServiceConnection_ProxyUserName Uživatelské jméno proxy serveru použitého pro připojení ke službě Cognitive Services Speech. Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte SpeechConfig::SetProxy. POZNÁMKA: Toto ID vlastnosti bylo přidáno ve verzi 1.1.0.
SpeechServiceConnection_ProxyPassword Heslo proxy serveru použitého k připojení ke službě Cognitive Services Speech. Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte SpeechConfig::SetProxy. POZNÁMKA: Toto ID vlastnosti bylo přidáno ve verzi 1.1.0.
SpeechServiceConnection_Url Řetězec adresy URL vytvořený z konfigurace řeči. Tato vlastnost je určena jen pro čtení. Sada SDK ji používá interně. POZNÁMKA: Přidáno ve verzi 1.5.0.
SpeechServiceConnection_TranslationToLanguages Seznam jazyků oddělených čárkami, které se používají jako cílové jazyky překladu. Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte SpeechTranslationConfig::AddTargetLanguage a SpeechTranslationConfig::GetTargetLanguages.
SpeechServiceConnection_TranslationVoice Název hlasu služby Cognitive Service z textu do služby Speech. Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte SpeechTranslationConfig::SetVoiceName. POZNÁMKA: Platná hlasová jména najdete tady.
SpeechServiceConnection_TranslationFeatures Funkce překladu. Pro interní použití.
SpeechServiceConnection_IntentRegion Oblast služby Language Understanding. Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte LanguageUnderstandingModel.
SpeechServiceConnection_RecoMode Režim rozpoznávání služby Cognitive Services Speech. Může to být "INTERACTIVE", "CONVERSATION", "DIKTOVÁNÍ". Tato vlastnost je určena jen pro čtení. Sada SDK ji používá interně.
SpeechServiceConnection_RecoLanguage Mluvený jazyk, který se má rozpoznat (ve formátu BCP-47). Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte SpeechConfig::SetSpeechRecognitionLanguage.
Speech_SessionId ID relace. Toto ID je univerzálně jedinečný identifikátor (neboli UUID), který představuje konkrétní vazbu streamu zvukového vstupu a základní instanci rozpoznávání řeči, na kterou je vázán. Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte SessionEventArgs::SessionId.
SpeechServiceConnection_UserDefinedQueryParameters Parametry dotazu poskytované uživateli. Předají se službě jako parametry dotazu adresy URL. Přidáno ve verzi 1.5.0.
SpeechServiceConnection_RecoBackend Řetězec pro určení back-endu, který má být použit pro rozpoznávání řeči; povolené možnosti jsou online a offline. Za normálních okolností byste tuto vlastnost neměli používat přímo. V současné době je možnost offline platná pouze při použití EmbeddedSpeechConfig. Přidáno ve verzi 1.19.0.
SpeechServiceConnection_RecoModelName Název modelu, který se má použít k rozpoznávání řeči. Za normálních okolností byste tuto vlastnost neměli používat přímo. V současné době platí pouze při použití EmbeddedSpeechConfig. Přidáno ve verzi 1.19.0.
SpeechServiceConnection_RecoModelKey Dešifrovací klíč modelu, který se má použít k rozpoznávání řeči. Za normálních okolností byste tuto vlastnost neměli používat přímo. V současné době platí pouze při použití EmbeddedSpeechConfig. Přidáno ve verzi 1.19.0.
SpeechServiceConnection_RecoModelIniFile Cesta k souboru ini modelu, který se má použít k rozpoznávání řeči. Za normálních okolností byste tuto vlastnost neměli používat přímo. V současné době platí pouze při použití EmbeddedSpeechConfig. Přidáno ve verzi 1.19.0.
SpeechServiceConnection_SynthLanguage Mluvený jazyk, který se má syntetizovat (např. en-US), přidaný ve verzi 1.4.0.
SpeechServiceConnection_SynthVoice Název hlasu TTS, který se má použít pro syntézu řeči Přidaný ve verzi 1.4.0.
SpeechServiceConnection_SynthOutputFormat Řetězec pro zadání výstupního zvukového formátu TTS přidaný ve verzi 1.4.0.
SpeechServiceConnection_SynthEnableCompressedAudioTransmission Označuje, jestli se pro přenos zvuku syntézy řeči používá komprimovaný formát zvuku. Tato vlastnost má vliv jenom na to, pokud je SpeechServiceConnection_SynthOutputFormat nastavený na formát pcm. Pokud tato vlastnost není nastavena a GStreamer je k dispozici, sada SDK použije komprimovaný formát pro syntetizovaný přenos zvuku a dekóduje ho. Tuto vlastnost můžete nastavit na false a použít tak formát raw pcm pro přenos po drátě. Přidáno ve verzi 1.16.0.
SpeechServiceConnection_SynthBackend Řetězec pro zadání back-endu TTS; platné možnosti jsou online a offline. Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte EmbeddedSpeechConfig::FromPath nebo EmbeddedSpeechConfig::FromPaths k nastavení back-endu syntézy na offline. Přidáno ve verzi 1.19.0.
SpeechServiceConnection_SynthOfflineDataPath Cesty k datovým souborům pro offline modul syntézy; platí pouze tehdy, když je back-end syntézy offline. Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte EmbeddedSpeechConfig::FromPath nebo EmbeddedSpeechConfig::FromPaths. Přidáno ve verzi 1.19.0.
SpeechServiceConnection_SynthOfflineVoice Název offline hlasu TTS, který se má použít pro syntézu řeči Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte EmbeddedSpeechConfig::SetSpeechSynthesisVoice a EmbeddedSpeechConfig::GetSpeechSynthesisVoiceName. Přidáno ve verzi 1.19.0.
SpeechServiceConnection_SynthModelKey Dešifrovací klíč hlasu, který se má použít pro syntézu řeči. Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte EmbeddedSpeechConfig::SetSpeechSynthesisVoice. Přidáno ve verzi 1.19.0.
SpeechServiceConnection_VoicesListEndpoint Seznam koncových bodů rozhraní API (URL) v hlasech služby Cognitive Services Speech Service Za normálních okolností nemusíte tuto vlastnost zadávat, sada SDK ji vytvoří na základě oblasti, hostitele nebo koncového bodu služby SpeechConfig. Přidáno ve verzi 1.16.0.
SpeechServiceConnection_InitialSilenceTimeoutMs Počáteční hodnota časového limitu ticha (v milisekundách) používaná službou Přidáno ve verzi 1.5.0.
SpeechServiceConnection_EndSilenceTimeoutMs Hodnota časového limitu koncového ticha (v milisekundách) používaná službou Přidáno ve verzi 1.5.0.
SpeechServiceConnection_EnableAudioLogging Logická hodnota určující, jestli je protokolování zvuku ve službě povolené nebo ne. Protokoly zvuku a obsahu se ukládají buď do úložiště vlastněného Microsoftem, nebo do vašeho vlastního účtu úložiště propojeného s vaším předplatným služeb Cognitive Services (přineste si vlastní úložiště (BYOS) s povoleným prostředkem Speech. Přidáno ve verzi 1.5.0.
SpeechServiceConnection_LanguageIdMode Režim identifikátoru jazyka připojení služby Speech. Může to být AtStart (výchozí) nebo Nepřetržitý. Viz Dokument identifikace jazyka . Přidáno ve 1.25.0.
SpeechServiceConnection_AutoDetectSourceLanguages Automatické rozpoznávání zdrojových jazyků přidané ve verzi 1.8.0
SpeechServiceConnection_AutoDetectSourceLanguageResult Výsledek automatické detekce zdrojového jazyka přidaný ve verzi 1.8.0.
SpeechServiceResponse_RequestDetailedResultTrueFalse Požadovaný výstupní formát odpovědi služby Cognitive Services Speech Service (jednoduchý nebo podrobný). Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte SpeechConfig::SetOutputFormat.
SpeechServiceResponse_RequestProfanityFilterTrueFalse Požadovaná úroveň výstupu vulgárních výrazů ve službě Cognitive Services Speech Service Aktuálně se nepoužívá.
SpeechServiceResponse_ProfanityOption Požadované nastavení výstupních vulgárních výrazů ve službě Cognitive Services Speech. Povolené hodnoty jsou "maskované", "odebrané" a "nezpracované". Přidáno ve verzi 1.5.0.
SpeechServiceResponse_PostProcessingOption Řetězcová hodnota určující, kterou možnost následného zpracování má služba použít. Povolené hodnoty jsou TrueText. Přidáno ve verzi 1.5.0.
SpeechServiceResponse_RequestWordLevelTimestamps Logická hodnota určující, zda se mají do výsledku odpovědi zahrnout časová razítka na úrovni slov. Přidáno ve verzi 1.5.0.
SpeechServiceResponse_StablePartialResultThreshold Kolikrát musí být slovo v částečných výsledcích, aby se vrátilo. Přidáno ve verzi 1.5.0.
SpeechServiceResponse_OutputFormatOption Řetězcová hodnota určující možnost výstupního formátu ve výsledku odpovědi. Pouze interní použití. Přidáno ve verzi 1.5.0.
SpeechServiceResponse_RequestSnr Logická hodnota určující, jestli se má do výsledku odpovědi zahrnout SNR (poměr signálu k šumu). Přidáno ve verzi 1.18.0.
SpeechServiceResponse_TranslationRequestStablePartialResult Logická hodnota, která se má požadovat pro stabilizaci částečných výsledků překladu vynecháním slov na konci. Přidáno ve verzi 1.5.0.
SpeechServiceResponse_RequestWordBoundary Logická hodnota určující, zda se mají vyžádat události WordBoundary. Přidáno ve verzi 1.21.0.
SpeechServiceResponse_RequestPunctuationBoundary Logická hodnota určující, zda se má požadovat hranice interpunkce v událostech WordBoundary. Platí výchozí hodnota. Přidáno ve verzi 1.21.0.
SpeechServiceResponse_RequestSentenceBoundary Logická hodnota určující, zda se má požádat o hranici věty v událostech WordBoundary. Výchozí hodnota je false. Přidáno ve verzi 1.21.0.
SpeechServiceResponse_SynthesisEventsSyncToAudio Logická hodnota určující, jestli má sada SDK synchronizovat události metadat syntézy (např. hranice slova, viseme atd.) s přehráváním zvuku. To se projeví jenom v případě, že se zvuk přehraje prostřednictvím sady SDK. Platí výchozí hodnota. Pokud je nastavená hodnota false, sada SDK aktivuje události tak, jak pocházejí ze služby, což může být nesynchronní s přehráváním zvuku. Přidáno ve verzi 1.31.0.
SpeechServiceResponse_JsonResult Výstup odpovědi služby Cognitive Services Speech Service (ve formátu JSON) Tato vlastnost je k dispozici pouze u objektů výsledků rozpoznávání.
SpeechServiceResponse_JsonErrorDetails Podrobnosti o chybě služby Cognitive Services Speech Service (ve formátu JSON) Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte CancellationDetails::ErrorDetails.
SpeechServiceResponse_RecognitionLatencyMs Latence rozpoznávání v milisekundách Jen pro čtení, dostupné pro konečné výsledky řeči, překladu nebo záměru. Tím se měří latence mezi tím, kdy sada SDK přijímá zvukový vstup, a okamžikem přijetí konečného výsledku ze služby. Sada SDK vypočítá časový rozdíl mezi posledním zvukovým fragmentem ze zvukového vstupu, který přispívá ke konečnému výsledku, a časem přijetí konečného výsledku ze služby Speech. Přidáno ve verzi 1.3.0.
SpeechServiceResponse_RecognitionBackend Back-end rozpoznávání. Jen pro čtení, dostupné ve výsledcích rozpoznávání řeči. To označuje, jestli se k vytvoření výsledku použilo cloudové (online) nebo vložené (offline) rozpoznávání.
SpeechServiceResponse_SynthesisFirstByteLatencyMs Latence první bajtové syntézy řeči v milisekundách Jen pro čtení, k dispozici u konečných výsledků syntézy řeči. Tím se měří latence mezi zahájením zpracování syntézy a okamžikem, kdy je k dispozici první bajtový zvuk. Přidáno ve verzi 1.17.0.
SpeechServiceResponse_SynthesisFinishLatencyMs Syntéza řeči všechny bajty latence v milisekundách. Jen pro čtení, k dispozici u konečných výsledků syntézy řeči. Tím se měří latence mezi zahájením zpracování syntézy a okamžikem syntetizování celého zvuku. Přidáno ve verzi 1.17.0.
SpeechServiceResponse_SynthesisUnderrunTimeMs Doba podprůběhu syntézy řeči v milisekundách Jen pro čtení, dostupné u výsledků v událostech SynthesisCompleted. Tím se měří celková doba podprůběhu z PropertyId::AudioConfig_PlaybackBufferLengthInMs je vyplněná, aby se syntéza dokončila. Přidáno ve verzi 1.17.0.
SpeechServiceResponse_SynthesisConnectionLatencyMs Latence připojení syntézy řeči v milisekundách Jen pro čtení, k dispozici u konečných výsledků syntézy řeči. Tím se měří latence mezi zahájením zpracování syntézy a okamžikem navázání připojení HTTP/WebSocket. Přidáno ve verzi 1.26.0.
SpeechServiceResponse_SynthesisNetworkLatencyMs Latence sítě syntézy řeči v milisekundách Jen pro čtení, k dispozici u konečných výsledků syntézy řeči. Tím se měří doba odezvy sítě. Přidáno ve verzi 1.26.0.
SpeechServiceResponse_SynthesisServiceLatencyMs Latence služby syntézy řeči v milisekundách Jen pro čtení, k dispozici u konečných výsledků syntézy řeči. Tím se měří doba zpracování služby k syntetizaci prvního bajtu zvuku. Přidáno ve verzi 1.26.0.
SpeechServiceResponse_SynthesisBackend Označuje, kterým back-endem je syntéza dokončena. Jen pro čtení, dostupné u výsledků syntézy řeči, s výjimkou výsledku v události SynthesisStarted Přidané ve verzi 1.17.0.
CancellationDetails_Reason Důvod zrušení. Aktuálně se nepoužívá.
CancellationDetails_ReasonText Text zrušení. Aktuálně se nepoužívá.
CancellationDetails_ReasonDetailedText Podrobný text zrušení Aktuálně se nepoužívá.
LanguageUnderstandingServiceResponse_JsonResult Výstup odpovědi služby Language Understanding (ve formátu JSON) K dispozici prostřednictvím IntentRecognitionResult.Properties.
AudioConfig_DeviceNameForCapture Název zařízení pro záznam zvuku. Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte AudioConfig::FromMicrophoneInput. POZNÁMKA: Toto ID vlastnosti bylo přidáno ve verzi 1.3.0.
AudioConfig_NumberOfChannelsForCapture Počet kanálů pro záznam zvuku. Pouze interní použití. POZNÁMKA: Toto ID vlastnosti bylo přidáno ve verzi 1.3.0.
AudioConfig_SampleRateForCapture Vzorkovací frekvence (v Hz) pro záznam zvuku. Pouze interní použití. POZNÁMKA: Toto ID vlastnosti bylo přidáno ve verzi 1.3.0.
AudioConfig_BitsPerSampleForCapture Počet bitů jednotlivých ukázek pro záznam zvuku. Pouze interní použití. POZNÁMKA: Toto ID vlastnosti bylo přidáno ve verzi 1.3.0.
AudioConfig_AudioSource Zdroj zvuku. Povolené hodnoty jsou "Mikrofony", "Soubor" a "Stream". Přidáno ve verzi 1.3.0.
AudioConfig_DeviceNameForRender Název zařízení pro vykreslování zvuku. Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte AudioConfig::FromSpeakerOutput. Přidáno ve verzi 1.14.0.
AudioConfig_PlaybackBufferLengthInMs Délka vyrovnávací paměti přehrávání v milisekundách, výchozí hodnota je 50 milisekund.
AudioConfig_AudioProcessingOptions Možnosti zpracování zvuku ve formátu JSON
Speech_LogFilename Název souboru pro zápis protokolů. Přidáno ve verzi 1.4.0.
Speech_SegmentationSilenceTimeoutMs Doba trvání zjištěného ticha měřená v milisekundách, po jejímž uplynutí řeč na text určí, že mluvená fráze skončila, a vygeneruje konečný rozpoznaný výsledek. Konfigurace tohoto časového limitu může být užitečná v situacích, kdy je mluvený vstup výrazně rychlejší nebo pomalejší než obvykle a výchozí chování segmentace konzistentně přináší výsledky, které jsou příliš dlouhé nebo příliš krátké. Hodnoty časového limitu segmentace, které jsou nevhodně vysoké nebo nízké, mohou negativně ovlivnit přesnost řeči na text; tato vlastnost by měla být pečlivě nakonfigurována a výsledné chování by mělo být důkladně ověřeno podle očekávání.
Conversation_ApplicationId Identifikátor použitý k připojení k back-endové službě. Přidáno ve verzi 1.5.0.
Conversation_DialogType Typ back-endu dialogového okna, ke kterému se chcete připojit. Přidáno ve verzi 1.7.0.
Conversation_Initial_Silence_Timeout Časový limit ticha pro poslech Přidané ve verzi 1.5.0
Conversation_From_Id Z ID, které se použije pro aktivity rozpoznávání řeči Přidané ve verzi 1.5.0.
Conversation_Conversation_Id ConversationId pro relaci. Přidáno ve verzi 1.8.0.
Conversation_Custom_Voice_Deployment_Ids Seznam ID nasazení vlastního hlasu oddělený čárkami. Přidáno ve verzi 1.8.0.
Conversation_Speech_Activity_Template Šablona aktivity řeči, razítko vlastnosti v šabloně pro aktivitu vygenerovanou službou pro řeč. Přidáno ve verzi 1.10.0.
Conversation_ParticipantId Identifikátor účastníka v aktuální konverzaci. Přidáno ve verzi 1.13.0.
Conversation_Request_Bot_Status_Messages
Conversation_Connection_Id
DataBuffer_TimeStamp Časové razítko přidružené k vyrovnávací paměti dat zapsané klientem při použití vstupních datových proudů pro vyžádání/odeslání. Časové razítko je 64bitová hodnota s rozlišením 90 kHz. Je stejné jako časové razítko prezentace v přenosovém streamu MPEG. Viz https://en.wikipedia.org/wiki/Presentation_timestamp Přidání ve verzi 1.5.0.
DataBuffer_UserId ID uživatele přidružené k vyrovnávací paměti dat zapsané klientem při použití vstupních datových proudů pro vyžádání/odeslání. Přidáno ve verzi 1.5.0.
PronunciationAssessment_ReferenceText Referenční text zvuku pro vyhodnocení výslovnosti. Informace o těchto a následujících parametrech posouzení výslovnosti najdete v tabulce Parametry posouzení výslovnosti. Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte PronuationAssessmentConfig::Create nebo PronunciationAssessmentConfig::SetReferenceText. Přidáno ve verzi 1.14.0.
PronunciationAssessment_GradingSystem Bodový systém kalibrace skóre výslovnosti (FivePoint nebo HundredMark). Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte pronuationAssessmentConfig::Create. Přidáno ve verzi 1.14.0.
PronunciationAssessment_Granularity Členitost vyhodnocení výslovnosti (Fonet, Word nebo FullText). Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte pronuationAssessmentConfig::Create. Přidáno ve verzi 1.14.0.
PronunciationAssessment_EnableMiscue Definuje, jestli povolí nesprávný výpočet. Když je tato možnost povolená, budou vyslovená slova porovnána s referenčním textem a na základě porovnání budou označena vynecháním nebo vložením. Výchozí nastavení je False. Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte pronuationAssessmentConfig::Create. Přidáno ve verzi 1.14.0.
PronunciationAssessment_PhonemeAlphabet Abeceda fonetu pro vyhodnocení výslovnosti. Platné hodnoty jsou SAPI (výchozí) a "IPA" Za normálních okolností byste neměli tuto vlastnost používat přímo. Místo toho použijte pronuationAssessmentConfig::SetPhonemeAlphabet. Přidáno ve verzi 1.20.0.
PronunciationAssessment_NBestPhonemeCount Hodnocení výslovnosti nbest phoneme count. Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte výslovnostAssessmentConfig::SetNBestPhonemeCount. Přidáno ve verzi 1.20.0.
PronunciationAssessment_EnableProsodyAssessment Jestli se má povolit hodnocení prosody. Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte výslovnostAssessmentConfig::EnableProsodyAssessment. Přidáno ve verzi 1.33.0.
PronunciationAssessment_Json Řetězec json parametrů posouzení výslovnosti Za normálních okolností byste neměli tuto vlastnost používat přímo. Místo toho použijte pronuationAssessmentConfig::Create. Přidáno ve verzi 1.14.0.
PronunciationAssessment_Params Parametry posouzení výslovnosti. Tato vlastnost je určena jen pro čtení. Sada SDK ji používá interně. Přidáno ve verzi 1.14.0.
PronunciationAssessment_ContentTopic Téma obsahu hodnocení výslovnosti. Za normálních okolností byste tuto vlastnost neměli používat přímo. Místo toho použijte výslovnostAssessmentConfig::EnableContentAssessmentWithTopic. Přidáno ve verzi 1.33.0.
SpeakerRecognition_Api_Version Verze back-endové rozhraní API pro rozpoznávání mluvčího Tato vlastnost je přidána, aby bylo možné v případě potřeby testovat a používat předchozí verze rozhraní API pro rozpoznávání mluvčího. Přidáno ve verzi 1.18.0.
SpeechTranslation_ModelName Název modelu, který se má použít k překladu řeči. Tuto vlastnost nepoužívejte přímo. V současné době platí pouze při použití EmbeddedSpeechConfig.
SpeechTranslation_ModelKey Dešifrovací klíč modelu, který se má použít k překladu řeči. Tuto vlastnost nepoužívejte přímo. V současné době platí pouze při použití EmbeddedSpeechConfig.
KeywordRecognition_ModelName Název modelu, který se má použít pro rozpoznávání klíčových slov. Tuto vlastnost nepoužívejte přímo. V současné době platí pouze při použití EmbeddedSpeechConfig.
KeywordRecognition_ModelKey Dešifrovací klíč modelu, který se má použít k rozpoznávání klíčových slov. Tuto vlastnost nepoužívejte přímo. V současné době platí pouze při použití EmbeddedSpeechConfig.
EmbeddedSpeech_EnablePerformanceMetrics Povolte shromažďování vložených metrik výkonu řeči, které se dají použít k vyhodnocení schopnosti zařízení používat vloženou řeč. Shromážděná data jsou zahrnuta ve výsledcích z konkrétních scénářů, jako je rozpoznávání řeči. Výchozí nastavení je false. Všimněte si, že metriky nemusí být dostupné ve všech scénářích vložené řeči.

Definuje ID vlastností řeči. Změněno ve verzi 1.4.0.

enum OutputFormat

Hodnoty Popisy
Jednoduchost
Detailed

Výstupní formát.

enum ProfanityOption

Hodnoty Popisy
Maskované Nahradí písmena v vulgárních slov star znaky.
Odebráno Odebere vulgární slova.
Žádný Nedělá nic na vulgární slova.

Odstraní vulgární výrazy (nadávky) nebo nahradí písmena vulgárních slov hvězdičkami. Přidáno ve verzi 1.5.0.

enum ResultReason

Hodnoty Popisy
NoMatch Označuje, že řeč nebyla rozpoznána. Další podrobnosti najdete v objektu NoMatchDetails.
Zrušeno Označuje, že rozpoznávání bylo zrušeno. Další podrobnosti najdete pomocí objektu CancellationDetails.
RozpoznáváníSpeech Označuje, že výsledek řeči obsahuje text hypotézy.
RecognizedSpeech Označuje výsledek řeči, který obsahuje konečný text, který byl rozpoznán. Rozpoznávání řeči je teď pro tuto frázi dokončené.
Rozpoznávánítentu Označuje, že výsledek záměru obsahuje text hypotézy a záměr.
RecognizedIntent Označuje, že výsledek záměru obsahuje konečný text a záměr. Rozpoznávání řeči a určení záměru jsou teď pro tuto frázi dokončené.
PřekladySpeech Označuje, že výsledek překladu obsahuje text hypotézy a jeho překlady.
PřeloženoSpeech Označuje výsledek překladu, který obsahuje konečný text a odpovídající překlady. Rozpoznávání řeči a překlad jsou teď pro tuto frázi dokončené.
SynthesizingAudio Označuje, že syntetizovaný zvukový výsledek obsahuje nenulová množství zvukových dat.
SynthesizingAudioCompleted Označuje, že syntetizovaný zvuk je teď pro tuto frázi dokončený.
Rozpoznávání klíče Označuje, že výsledek řeči obsahuje (neověřený) text klíčového slova. Přidáno ve verzi 1.3.0.
Rozpoznanéklíčové slovo Označuje, že rozpoznávání klíčového slova bylo dokončeno rozpoznáním daného klíčového slova. Přidáno ve verzi 1.3.0.
SynthesizingAudioStarted Označuje, že syntéza řeči je nyní spuštěna Přidání ve verzi 1.4.0.
PřekladParticipantSpeech Označuje výsledek přepisu, který obsahuje text hypotézy a jeho překlady pro ostatní účastníky konverzace. Přidáno ve verzi 1.8.0.
PřeloženoParticipantSpeech Označuje výsledek přepisu, který obsahuje konečný text a odpovídající překlady pro ostatní účastníky konverzace. Rozpoznávání řeči a překlad jsou teď pro tuto frázi dokončené. Přidáno ve verzi 1.8.0.
PřeloženoInstantMessage Označuje výsledek přepisu, který obsahuje rychlou zprávu a odpovídající překlady. Přidáno ve verzi 1.8.0.
PřeloženoParticipantInstantMessage Označuje výsledek přepisu, který obsahuje rychlou zprávu pro ostatní účastníky konverzace a odpovídající překlady. Přidáno ve verzi 1.8.0.
EnrollingVoiceProfile Označuje registraci hlasového profilu a zákazníci potřebují odeslat více zvuku, aby vytvořili hlasový profil. Přidáno ve verzi 1.12.0.
EnrolledVoiceProfile Hlasový profil je zaregistrovaný. Přidáno ve verzi 1.12.0.
RecognizedSpeakers Označuje úspěšnou identifikaci některých mluvčích. Přidáno ve verzi 1.12.0.
RecognizedSpeaker Označuje úspěšné ověření jednoho mluvčího. Přidáno ve verzi 1.12.0.
ResetVoiceProfile Označuje úspěšné resetování hlasového profilu. Přidáno ve verzi 1.12.0.
OdstraněnoVoiceProfile Označuje, že hlasový profil byl úspěšně odstraněn. Přidáno ve verzi 1.12.0.
VoicesListRetrieved Označuje, že seznam hlasů se úspěšně načetl. Přidáno ve verzi 1.16.0.

Určuje možné důvody, proč může být výsledek rozpoznávání vygenerován.

enum CancellationReason

Hodnoty Popisy
Chyba Označuje, že při rozpoznávání řeči došlo k chybě.
EndOfStream Označuje, že bylo dosaženo konce zvukového streamu.
CancelledByUser Označuje, že žádost byla zrušena uživatelem. Přidáno ve verzi 1.14.0.

Definuje možné důvody zrušení výsledku rozpoznávání.

enum CancellationErrorCode

Hodnoty Popisy
Chyba NoError Žádná chyba. Pokud CancellationReason je EndOfStream, CancellationErrorCode je nastaven na NoError.
AuthenticationFailure Označuje chybu ověřování. K chybě ověřování dochází, pokud je klíč předplatného nebo autorizační token neplatný, vypršela jeho platnost nebo neodpovídá používané oblasti.
BadRequest Označuje, že jeden nebo více parametrů rozpoznávání je neplatných nebo že není podporovaný formát zvuku.
TooManyRequests Označuje, že počet paralelních požadavků překročil počet povolených souběžných přepisů pro předplatné.
Forbidden Označuje, že u bezplatného předplatného používaného žádostí došlo k dosažení kvóty.
ConnectionFailure Označuje chybu připojení.
ServiceTimeout Označuje chybu časového limitu při čekání na odpověď ze služby.
Chyba služby Označuje, že služba vrátí chybu.
ServiceUnavailable Označuje, že služba je momentálně nedostupná.
Chyba modulu runtime Označuje neočekávanou chybu modulu runtime.
ServiceRedirectTemporary Označuje, že služba Speech dočasně žádá o opětovné připojení k jinému koncovému bodu.
ServiceRedirectPermanent Označuje, že služba Speech trvale žádá o opětovné připojení k jinému koncovému bodu.
EmbeddedModelError Označuje, že model vložené řeči (SR nebo TTS) není k dispozici nebo je poškozený.

Definuje kód chyby v případě, že CancellationReason je Error. Přidáno ve verzi 1.1.0.

enum NoMatchReason

Hodnoty Popisy
Nerozpoznané Označuje, že řeč byla zjištěna, ale nebyla rozpoznána.
InitialSilenceTimeout Označuje, že spuštění zvukového streamu obsahovalo pouze ticho a služba vypršel časový limit čekání na řeč.
InitialBabbleTimeout Označuje, že spuštění zvukového streamu obsahovalo pouze šum a časový limit služby vypršel čekáním na řeč.
KeywordNotRecognized Označuje, že služba pro ověření klíčových slov odmítla klíčové slovo. Přidáno ve verzi 1.5.0.
EndSilenceTimeout Označuje, že zvukový stream obsahoval pouze ticho po poslední rozpoznané frázi.

Definuje možné důvody, proč nemusí být rozpoznán výsledek rozpoznávání.

výčet ActivityJSONType

Hodnoty Popisy
Null
Objekt
Pole
Řetězec
dvojité
Uint
Int
Logická hodnota

Definuje možné typy pro hodnotu JSON aktivity. Přidáno ve verzi 1.5.0.

enum SpeechSynthesisOutputFormat

Hodnoty Popisy
Raw8Khz8BitMonoMULaw raw-8kHz-8bit-mono-mulaw
Riff16Khz16KbpsMonoSiren riff-16kHz-16kbps-mono-siren Služba nepodporuje. Tuto hodnotu nepoužívejte.
Audio16Khz16KbpsMonoSiren audio-16kHz-16kbps-mono-siren Není podporováno službou. Tuto hodnotu nepoužívejte.
Audio16Khz32KBitRateMonoMp3 audio-16kHz-32kbitrate-mono-mp3
Audio16Khz128KBitRateMonoMp3 audio-16kHz-128kbitrate-mono-mp3
Audio16Khz64KBitRateMonoMp3 audio-16kHz-64kbitrate-mono-mp3
Audio24Khz48KBitRateMonoMp3 audio-24kHz-48kbitrate-mono-mp3
Audio24Khz96KBitRateMonoMp3 audio-24kHz-96kbitrate-mono-mp3
Audio24Khz160KBitRateMonoMp3 audio-24kHz-160kbitrate-mono-mp3
Raw16Khz16BitMonoTrueSilk raw-16kHz-16bit-mono-truesilk
Riff16Khz16BitMonoPcm riff-16kHz-16bit-mono-pcm
Riff8Khz16BitMonoPcm riff-8kHz-16bit-mono-pcm
Riff24Khz16BitMonoPcm riff-24kHz-16bit-mono-pcm
Riff8Khz8BitMonoMULaw riff-8kHz-8bit-mono-mulaw
Raw16Khz16BitMonoPcm raw-16kHz-16bit-mono-pcm
Raw24Khz16BitMonoPcm raw-24kHz-16bit-mono-pcm
Raw8Khz16BitMonoPcm raw-8kHz-16bit-mono-pcm
Ogg16Khz16BitMonoOpus ogg-16kHz-16bit-mono-opus
Ogg24Khz16BitMonoOpus ogg-24kHz-16bit-mono-opus
Raw48Khz16BitMonoPcm raw-48kHz-16bit-mono-pcm
Riff48Khz16BitMonoPcm riff-48kHz-16bit-mono-pcm
Audio48Khz96KBitRateMonoMp3 audio-48kHz-96kbitrate-mono-mp3
Audio48Khz192KBitRateMonoMp3 audio-48kHz-192kbitrate-mono-mp3
Ogg48Khz16BitMonoOpus ogg-48kHz-16bit-mono-opus Přidáno ve verzi 1.16.0
Webm16Khz16BitMonoOpus webm-16kHz-16bit-mono-opus Přidáno ve verzi 1.16.0
Webm24Khz16BitMonoOpus webm-24khz-16bit-mono-opus Přidáno ve verzi 1.16.0
Raw24Khz16BitMonoTrueSilk raw-24kHz-16bit-mono-truesilk Přidáno ve verzi 1.17.0
Raw8Khz8BitMonoALaw raw-8kHz-8bit-mono-alaw Přidáno ve verzi 1.17.0
Riff8Khz8BitMonoALaw riff-8khz-8bit-mono-alaw Přidáno ve verzi 1.17.0
Webm24Khz16Bit24KbpsMonoOpus webm-24kHz-16bit-24kbps-mono-opus Audio komprimované kodekem OPUS v kontejneru WebM s přenosovou rychlostí 24 kB, optimalizované pro scénář IoT. (Přidáno ve 1.19.0)
Audio16Khz16Bit32KbpsMonoOpus audio-16kHz-16bit-32kbps-mono-opus Zvuk komprimovaný kodekem OPUS bez kontejneru, s přenosovou rychlostí 32kbps. (Přidáno ve 1.20.0)
Audio24Khz16Bit48KbpsMonoOpus audio-24kHz-16bit-48kbps-mono-opus Zvuk komprimovaný kodekem OPUS bez kontejneru, s přenosovou rychlostí 48kbps. (Přidáno ve 1.20.0)
Audio24Khz16Bit24KbpsMonoOpus audio-24kHz-16bit-24kbps-mono-opus Zvuk komprimovaný kodekem OPUS bez kontejneru s přenosovou rychlostí 24kbps. (Přidáno ve 1.20.0)
Raw22050Hz16BitMonoPcm raw-22050hz-16bit-mono-pcm Raw PCM audio s vzorkovací frekvencí 22050 Hz a 16bitovou hloubkou. (Přidáno ve 1.22.0)
Riff22050Hz16BitMonoPcm riff-22050hz-16bit-mono-pcm PCM audio s vzorkovací frekvencí 22050 Hz a 16bitovou hloubkou s hlavičkou RIFF. (Přidáno ve 1.22.0)
Raw44100Hz16BitMonoPcm raw-44100hz-16bit-mono-pcm Raw PCM audio s vzorkovací frekvencí 44100Hz a 16bitovou hloubkou. (Přidáno ve 1.22.0)
Riff44100Hz16BitMonoPcm riff-44100hz-16bit-mono-pcm PCM audio s vzorkovací frekvencí 44100 Hz a 16bitovou hloubkou s hlavičkou RIFF. (Přidáno ve 1.22.0)
AmrWb16000Hz amr-wb-16000Hz AMR-WB zvuk při vzorkovací frekvenci 16 kHz. (Přidáno ve 1.24.0)

Definuje možné výstupní zvukové formáty syntézy řeči. Aktualizováno ve verzi 1.19.0.

enum StreamStatus

Hodnoty Popisy
Neznámý Stav streamu zvukových dat je neznámý.
NoData Stream zvukových dat neobsahuje žádná data.
PartialData Stream zvukových dat obsahuje částečná data žádosti o mluvení.
AllData Stream zvukových dat obsahuje všechna data žádosti o mluvení.
Zrušeno Datový proud zvuku byl zrušen.

Definuje možný stav zvukového datového proudu. Přidáno ve verzi 1.4.0.

enum ServicePropertyChannel

Hodnoty Popisy
UriQueryParameter Používá parametr dotazu URI k předávání nastavení vlastnosti službě.
HttpHeader Používá HttpHeader k nastavení klíče/hodnoty v hlavičce HTTP.

Definuje kanály používané k předávání nastavení vlastností do služby. Přidáno ve verzi 1.5.0.

enum VoiceProfileType

Hodnoty Popisy
TextIndependentIdentification Identifikace mluvčího nezávislá na textu.
TextDependentVerification Ověření mluvčího závislého na textu.
TextIndependentVerification Nezávislé ověření textu.

Definuje typy hlasových profilů.

výčet RecognitionFactorScope

Hodnoty Popisy
Částečná fráze Faktor rozpoznávání se použije pro gramatiky, na které lze odkazovat jako na jednotlivé částečné fráze.

Definuje obor, na který se vztahuje faktor rozpoznávání.

enum PronunciationAssessmentGradingSystem

Hodnoty Popisy
Pět bodů Kalibrace pěti bodů.
HundredMark Sto známek.

Definuje bodový systém pro kalibraci skóre výslovnosti; výchozí hodnota je FivePoint. Přidáno ve verzi 1.14.0.

enum PronuationAssessmentGranularity

Hodnoty Popisy
Foném Zobrazuje skóre na úrovni fulltextu, slova a fonému.
Word Zobrazuje skóre na úrovni celého textu a slova.
Fulltextové Zobrazuje skóre pouze na úrovni fulltextu.

Definuje členitost vyhodnocení výslovnosti; výchozí hodnota je Phoneme. Přidáno ve verzi 1.14.0.

enum SynthesisVoiceType

Hodnoty Popisy
OnlineNeural Online neurální hlas.
OnlineStandard Standardní online hlas.
OfflineNeural Offline neurální hlas.
Offlinestandard Standardní offline hlas.

Definuje typ syntézy hlasů přidaných ve verzi 1.16.0.

enum SynthesisVoiceGender

Hodnoty Popisy
Neznámý Pohlaví je neznámé.
Female Ženský hlas.
Male Mužský hlas.

Definuje pohlaví hlasů syntézy přidané ve verzi 1.17.0.

enum SpeechSynthesisBoundaryType

Hodnoty Popisy
Word Word hranice.
Interpunkční znaménka Interpunkční znaméně.
Věta Hranice vět.

Definuje typ hranice události hranice syntézy řeči přidané ve verzi 1.21.0.