microsoft-cognitiveservices-speech-sdk package
Třídy
ActivityReceivedEventArgs |
Definuje obsah přijatých zpráv nebo událostí. |
AudioConfig |
Představuje konfiguraci zvukového vstupu, která se používá k určení typu vstupu, který se má použít (mikrofon, soubor, stream). |
AudioInputStream |
Představuje datový proud vstupu zvuku, který se používá pro vlastní konfigurace vstupu zvuku. |
AudioOutputStream |
Představuje zvukový výstupní stream používaný pro vlastní konfigurace zvukového výstupu. |
AudioStreamFormat |
Představuje formát zvukového streamu, který se používá pro vlastní konfigurace vstupu zvuku. |
AutoDetectSourceLanguageConfig |
Automatická detekce konfigurace jazyka |
AutoDetectSourceLanguageResult |
Formát výstupu |
AvatarConfig |
Definuje konfiguraci mluvícího avatara. |
AvatarEventArgs |
Definuje obsah pro mluvící události avatarů. |
AvatarSynthesizer |
Definuje syntezátor avatara. |
AvatarVideoFormat |
Definuje výstupní formát videa avatara. |
AvatarWebRTCConnectionResult |
Definuje výsledek připojení WebRTC avatara. |
BaseAudioPlayer |
Základní třída přehrávače zvuku TODO: Prozatím přehrává pouze PCM. |
BotFrameworkConfig |
Třída, která definuje konfigurace pro objekt konektoru služby dialogového okna pro použití back-endu Bot Framework. |
CancellationDetails |
Obsahuje podrobné informace o tom, proč byl výsledek zrušen. |
CancellationDetailsBase |
Obsahuje podrobné informace o tom, proč byl výsledek zrušen. |
Connection |
Připojení je třída proxy pro správu připojení k řečové službě zadaného rozpoznávání. Rozpoznávání ve výchozím nastavení v případě potřeby samostatně spravuje připojení ke službě. Třída Connection poskytuje uživatelům další metody, jak explicitně otevřít nebo zavřít připojení a přihlásit se k odběru změn stavu připojení. Použití funkce Připojení je volitelné, a to hlavně ve scénářích, kdy je potřeba jemně doladit chování aplikace na základě stavu připojení. Uživatelé můžou volitelně volat Open(), aby předem ručně nastavili připojení před zahájením rozpoznávání v rozpoznávání přidruženém k tomuto připojení. Pokud se rozpoznávání potřebuje připojit nebo odpojit ke službě, nastaví nebo vypne připojení nezávisle na sobě. V takovém případě bude připojení upozorněno na změnu stavu připojení prostřednictvím událostí Připojeno/Odpojeno. Přidáno ve verzi 1.2.1. |
ConnectionEventArgs |
Definuje datovou část pro události připojení, jako je Připojeno/Odpojeno. Přidáno ve verzi 1.2.0 |
ConnectionMessage |
ConnectionMessage představuje zprávy specifické pro implementaci odesílané do služby speech a přijaté z této služby. Tyto zprávy jsou poskytovány pro účely ladění a neměly by se používat pro produkční případy použití se službou Azure Cognitive Services Speech Service. Zprávy odeslané službě Speech a přijaté z této služby se můžou změnit bez předchozího upozornění. To zahrnuje obsah zpráv, záhlaví, datové části, řazení atd. Přidáno ve verzi 1.11.0. |
ConnectionMessageEventArgs | |
Conversation | |
ConversationExpirationEventArgs |
Definuje obsah pro události relace, jako jsou SessionStarted/Stopped, SoundStarted/Stopped. |
ConversationParticipantsChangedEventArgs |
Definuje obsah pro události relace, jako jsou SessionStarted/Stopped, SoundStarted/Stopped. |
ConversationTranscriber |
Provádí rozpoznávání řeči s oddělením reproduktoru od mikrofonu, souboru nebo jiných zvukových vstupních streamů a jako výsledek získá přepis textu. |
ConversationTranscriptionCanceledEventArgs |
Definuje obsah RecognitionErrorEvent. |
ConversationTranscriptionEventArgs |
Definuje obsah události přepisu/přepisu konverzace. |
ConversationTranscriptionResult |
Definuje výsledek přepisu konverzace. |
ConversationTranslationCanceledEventArgs | |
ConversationTranslationEventArgs |
Definuje datovou část pro události relace, jako je zjištění zahájení/ukončení řeči. |
ConversationTranslationResult |
Výsledek textu překladu. |
ConversationTranslator |
Připojte se ke konverzaci, odejděte nebo se k ní připojte. |
Coordinate |
Definuje souřadnici ve 2D prostoru. |
CustomCommandsConfig |
Třída, která definuje konfigurace pro objekt konektoru služby dialogového okna pro použití back-endu CustomCommands. |
Diagnostics |
Definuje rozhraní API diagnostiky pro správu výstupu konzoly přidaného ve verzi 1.21.0. |
DialogServiceConfig |
Třída, která definuje základní konfigurace pro konektor služby dialogů |
DialogServiceConnector |
Konektor služby dialogového okna |
IntentRecognitionCanceledEventArgs |
Definujte datovou část událostí zrušených výsledků rozpoznávání záměru. |
IntentRecognitionEventArgs |
Argumenty události výsledku rozpoznávání záměru. |
IntentRecognitionResult |
Výsledek rozpoznávání záměru. |
IntentRecognizer |
Rozpoznávání záměru. |
KeywordRecognitionModel |
Představuje model rozpoznávání klíčových slov, který rozpozná, když uživatel řekne klíčové slovo pro zahájení dalšího rozpoznávání řeči. |
LanguageUnderstandingModel |
Model pro porozumění jazyku |
Meeting | |
MeetingTranscriber | |
MeetingTranscriptionCanceledEventArgs |
Definuje obsah MeetingTranscriptionCanceledEvent. |
MeetingTranscriptionEventArgs |
Definuje obsah události přepisu/přepisu schůzky. |
NoMatchDetails |
Obsahuje podrobné informace o výsledcích rozpoznávání NoMatch. |
Participant |
Představuje účastníka konverzace. Přidáno ve verzi 1.4.0 |
PhraseListGrammar |
Umožňuje přidání nových frází, aby se zlepšilo rozpoznávání řeči. Fráze přidané do rozpoznávání se projeví na začátku dalšího rozpoznávání nebo při příštím připojení sady SpeechSDK k řečové službě. |
PronunciationAssessmentConfig |
Konfigurace posouzení výslovnosti. |
PronunciationAssessmentResult |
Výsledky posouzení výslovnosti. |
PropertyCollection |
Představuje kolekci vlastností a jejich hodnot. |
PullAudioInputStream |
Představuje datový proud vstupu zvuku, který se používá pro vlastní konfigurace vstupu zvuku. |
PullAudioInputStreamCallback |
Abstraktní základní třída, která definuje metody zpětného volání (read() a close()) pro vlastní zvukové vstupní streamy). |
PullAudioOutputStream |
Představuje stream výstupu nabízeného zvuku s podporou paměti, který se používá pro vlastní konfigurace zvukového výstupu. |
PushAudioInputStream |
Představuje stream nabízeného zvukového vstupu s podporou paměti, který se používá pro vlastní konfigurace zvukového vstupu. |
PushAudioOutputStream |
Představuje zvukový výstupní stream používaný pro vlastní konfigurace zvukového výstupu. |
PushAudioOutputStreamCallback |
Abstraktní základní třída, která definuje metody zpětného volání (write() a close()) pro vlastní zvukové výstupní streamy). |
RecognitionEventArgs |
Definuje datovou část pro události relace, jako je zjištění zahájení/ukončení řeči. |
RecognitionResult |
Definuje výsledek rozpoznávání řeči. |
Recognizer |
Definuje rozpoznávání základní třídy, která obsahuje hlavně běžné obslužné rutiny událostí. |
ServiceEventArgs |
Definuje datovou část pro všechny události zprávy služby přidané ve verzi 1.9.0. |
SessionEventArgs |
Definuje obsah pro události relace, jako jsou SessionStarted/Stopped, SoundStarted/Stopped. |
SourceLanguageConfig |
Konfigurace zdrojového jazyka. |
SpeakerAudioDestination |
Představuje cíl přehrávání zvuku reproduktoru, který funguje pouze v prohlížeči. Poznámka: Sada SDK se pokusí použít rozšíření zdroje médií k přehrávání zvuku. Formát Mp3 má lepší podporu pro Microsoft Edge, Chrome a Safari (desktop), takže je lepší zadat formát mp3 pro přehrávání. |
SpeakerIdentificationModel |
Definuje třídu SpeakerIdentificationModel pro model rozpoznávání mluvčího obsahuje sadu profilů, podle kterých lze identifikovat mluvčí. |
SpeakerRecognitionCancellationDetails | |
SpeakerRecognitionResult |
Formát výstupu |
SpeakerRecognizer |
Definuje třídu SpeakerRecognizer pro operace rozpoznávání mluvčího od uživatele pro operace hlasového profilu (např. createProfile, deleteProfile). |
SpeakerVerificationModel |
Definuje třídu SpeakerVerificationModel pro model rozpoznávání mluvčího obsahuje profil, proti kterému se má ověřit mluvčí. |
SpeechConfig |
Konfigurace řeči. |
SpeechConfigImpl | |
SpeechRecognitionCanceledEventArgs | |
SpeechRecognitionEventArgs |
Definuje obsah rozpoznávání/rozpoznané události řeči. |
SpeechRecognitionResult |
Definuje výsledek rozpoznávání řeči. |
SpeechRecognizer |
Rozpoznává řeč z mikrofonu, souboru nebo jiných vstupních zvukových proudů a jako výsledek získá přepis textu. |
SpeechSynthesisBookmarkEventArgs |
Definuje obsah události záložky syntézy řeči. |
SpeechSynthesisEventArgs |
Definuje obsah událostí syntézy řeči. |
SpeechSynthesisResult |
Definuje výsledek syntézy řeči. |
SpeechSynthesisVisemeEventArgs |
Definuje obsah události viseme syntézy řeči. |
SpeechSynthesisWordBoundaryEventArgs |
Definuje obsah události hranice slova syntézy řeči. |
SpeechSynthesizer |
Definuje třídu SpeechSynthesizer pro převod textu na řeč. Aktualizace ve verzi 1.16.0 |
SpeechTranslationConfig |
Konfigurace překladu řeči. |
SynthesisResult |
Základní třída pro výsledky syntézy |
SynthesisVoicesResult |
Definuje výsledek syntézy řeči. |
Synthesizer | |
TranslationRecognitionCanceledEventArgs |
Definujte datovou část událostí zrušených výsledků rozpoznávání řeči. |
TranslationRecognitionEventArgs |
Argumenty události výsledku překladu textu |
TranslationRecognitionResult |
Výsledek textu překladu. |
TranslationRecognizer |
Rozpoznávání překladu |
TranslationSynthesisEventArgs |
Argumenty události syntézy překladu |
TranslationSynthesisResult |
Definuje výsledek syntézy překladu, tj. hlasový výstup přeloženého textu v cílovém jazyce. |
Translations |
Představuje kolekci parametrů a jejich hodnot. |
TurnStatusReceivedEventArgs |
Definuje obsah přijatých zpráv nebo událostí. |
User | |
VoiceInfo |
Informace o hlasové syntéze řeči přidané ve verzi 1.20.0. |
VoiceProfile |
Definuje třídu hlasového profilu pro rozpoznávání mluvčího. |
VoiceProfileCancellationDetails | |
VoiceProfileClient |
Definuje třídu VoiceProfileClient pro operace rozpoznávání mluvčího od uživatele pro operace hlasového profilu (např. createProfile, deleteProfile). |
VoiceProfileEnrollmentCancellationDetails | |
VoiceProfileEnrollmentResult |
Formát výstupu |
VoiceProfilePhraseResult |
Formát výstupu |
VoiceProfileResult |
Formát výstupu |
Rozhraní
CancellationEventArgs | |
ConversationInfo | |
IParticipant |
Představuje účastníka konverzace. Přidáno ve verzi 1.4.0 |
IPlayer |
Představuje rozhraní přehrávače zvuku pro ovládání přehrávání zvuku, jako je pozastavení, obnovení atd. |
IVoiceJson | |
MeetingInfo | |
VoiceSignature |
Výčty
AudioFormatTag | |
CancellationErrorCode |
Definuje kód chyby v případě, že CancellationReason je Error. Přidáno ve verzi 1.1.0. |
CancellationReason |
Definuje možné důvody zrušení výsledku rozpoznávání. |
LanguageIdMode |
Režim identifikace jazyka |
LogLevel | |
NoMatchReason |
Definuje možné důvody, proč nemusí být rozpoznán výsledek rozpoznávání. |
OutputFormat |
Definujte výstupní formáty Rozpoznávání řeči. |
ParticipantChangedReason | |
ProfanityOption |
Možnost vulgárních výrazů. Přidáno ve verzi 1.7.0. |
PronunciationAssessmentGradingSystem |
Definuje bodový systém pro kalibraci skóre výslovnosti; výchozí hodnota je FivePoint. Přidáno ve verzi 1.15.0 |
PronunciationAssessmentGranularity |
Definuje členitost vyhodnocení výslovnosti; výchozí hodnota je Phoneme. Přidáno ve verzi 1.15.0 |
PropertyId |
Definuje ID vlastností řeči. |
ResultReason |
Definuje možné důvody, proč může být vygenerován výsledek rozpoznávání. |
ServicePropertyChannel |
Definuje kanály používané k předávání nastavení vlastností do služby. Přidáno ve verzi 1.7.0. |
SpeakerRecognitionResultType | |
SpeechSynthesisBoundaryType |
Definuje typ hranice události hranice syntézy řeči. |
SpeechSynthesisOutputFormat |
Definujte formáty zvukového výstupu syntézy řeči. SpeechSynthesisOutputFormat Aktualizováno ve verzi 1.17.0 |
VoiceProfileType |
Formát výstupu |