Пространство имен Microsoft::CognitiveServices::Speech

Итоги

Элементы Описания
enum PropertyId Определяет идентификаторы свойств речи. Изменено в версии 1.4.0.
enum OutputFormat Формат вывода.
enum ProfanityOption Удаляет ненормативную лексику (ругательства) или заменяет буквы ненормативной лексики звездами. Добавлено в версии 1.5.0.
перечисление ResultReason Указывает возможные причины, по которым может быть создан результат распознавания.
enum CancellationReason Определяет возможные причины отмены результата распознавания.
enum CancellationErrorCode Определяет код ошибки в случае, если CancellationReason имеет значение Error. Добавлено в версии 1.1.0.
enum NoMatchReason Определяет возможные причины, по которым результат распознавания может не распознаться.
enum ActivityJSONType Определяет возможные типы для значения JSON действия. Добавлено в версии 1.5.0.
enum SpeechSynthesisOutputFormat Определяет возможные форматы выходных аудиоданных синтеза речи. Обновлено в версии 1.19.0.
enum StreamStatus Определяет возможное состояние потока аудиоданных. Добавлено в версии 1.4.0.
enum ServicePropertyChannel Определяет каналы, используемые для передачи параметров свойств в службу. Добавлено в версии 1.5.0.
enum VoiceProfileType Определяет типы голосовых профилей.
enum RecognitionFactorScope Определяет область, к которому применяется коэффициент распознавания.
enum PronunciationAssessmentGradingSystem Определяет систему точек для калибровки оценки произношения; Значение по умолчанию — FivePoint. Добавлено в версии 1.14.0.
enum PronunciationAssessmentGranularity Определяет степень детализации оценки произношения; Значение по умолчанию — Phoneme. Добавлено в версии 1.14.0.
enum SynthesisVoiceType Определяет тип голосов синтеза, добавленных в версии 1.16.0.
enum SynthesisVoiceGender Определяет пол голосов синтеза, добавленных в версии 1.17.0.
enum SpeechSynthesisBoundaryType Определяет тип границы события границ синтеза речи, добавленного в версии 1.21.0.
class AsyncRecognizer Абстрактный базовый класс AsyncRecognizer.
class AudioDataStream Представляет поток аудиоданных, используемый для работы с звуковыми данными в виде потока. Добавлено в версии 1.4.0.
class AutoDetectSourceLanguageConfig Класс, определяющий конфигурацию источника автоматического обнаружения Обновлено в версии 1.13.0.
class AutoDetectSourceLanguageResult Содержит автоматически обнаруженный результат исходного языка, добавленный в версии 1.8.0.
class BaseAsyncRecognizer Класс BaseAsyncRecognizer.
class CancellationDetails Содержит подробные сведения о том, почему результат был отменен.
class ClassLanguageModel Представляет список грамматик для сценариев динамической грамматики. Добавлено в версии 1.7.0.
class Connection Connection — это прокси-класс для управления подключением к службе распознавания речи указанного распознавателя. По умолчанию Распознаватель автономно управляет подключением к службе при необходимости. Класс Connection предоставляет пользователям дополнительные методы для явного открытия или закрытия подключения и подписки на изменения состояния подключения. Подключение является необязательным. Он предназначен для сценариев, в которых требуется точная настройка поведения приложения на основе состояния подключения. При необходимости пользователи могут вызвать Open(), чтобы вручную инициировать подключение к службе перед запуском распознавания распознавателя, связанного с этим подключением. После запуска распознавания вызов Метода Open() или Close() может завершиться ошибкой. Это не повлияет на Распознаватель или текущее распознавание. Подключение может прервать по разным причинам. Распознаватель всегда будет пытаться повторно установить подключение, как это необходимо для обеспечения текущих операций. Во всех этих случаях события Connected/Disconnected указывают на изменение состояния подключения. Обновлено в версии 1.17.0.
class ConnectionEventArgs Предоставляет данные для connectionEvent. Добавлено в версии 1.2.0.
class ConnectionMessage ConnectionMessage представляет сообщения для конкретной реализации, отправляемые в службу распознавания речи и полученные от нее. Эти сообщения предоставляются в целях отладки и не должны использоваться в рабочих сценариях использования службы "Речь" Azure Cognitive Services. Сообщения, отправленные в службу "Речь" и полученные из нее, могут изменяться без предварительного уведомления. Сюда входит содержимое сообщений, заголовки, полезные данные, порядок и т. д. Добавлено в версии 1.10.0.
class ConnectionMessageEventArgs Предоставляет данные для ConnectionMessageEvent.
class EmbeddedSpeechConfig Класс, определяющий внедренную (автономную) конфигурацию речи.
class EventArgs Базовый класс для аргументов события.
class EventSignal Клиенты могут подключаться к сигналу события для получения событий или отключаться от сигнала события, чтобы прекратить получение событий.
class EventSignalBase Клиенты могут подключаться к сигналу события для получения событий или отключаться от сигнала события, чтобы прекратить получение событий.
class Grammar Представляет грамматику базового класса для настройки распознавания речи. Добавлено в версии 1.5.0.
class GrammarList Представляет список грамматик для сценариев динамической грамматики. Добавлено в версии 1.7.0.
class GrammarPhrase Представляет фразу, которую может произносить пользователь. Добавлено в версии 1.5.0.
class HybridSpeechConfig Класс, определяющий гибридные (облачные и внедренные) конфигурации для распознавания речи или синтеза речи.
class KeywordRecognitionEventArgs Класс для событий, эмитированных KeywordRecognizer.
class KeywordRecognitionModel Представляет модель распознавания ключевых слов, используемую с методами StartKeywordRecognitionAsync.
class KeywordRecognitionResult Класс, определяющий результаты, выдаваемые KeywordRecognizer.
class KeywordRecognizer Тип распознавателя, специализированный для обработки только активации ключевых слов.
класс NoMatchDetails Содержит подробные сведения о результатах распознавания NoMatch.
class PhraseListGrammar Представляет грамматику списка фраз для сценариев динамической грамматики. Добавлено в версии 1.5.0.
class PronunciationAssessmentConfig Класс, определяющий конфигурацию оценки произношения, добавленный в версии 1.14.0.
class PronunciationAssessmentResult Класс для результатов оценки произношения.
class PropertyCollection Класс для получения или задания значения свойства из коллекции свойств.
class RecognitionEventArgs Предоставляет данные для RecognitionEvent.
class RecognitionResult Содержит подробные сведения о результате операции распознавания.
Распознаватель класса Базовый класс Распознавателя.
class SessionEventArgs Базовый класс для аргументов события сеанса.
класс SmartHandle Класс интеллектуального дескриптора.
class SourceLanguageConfig Класс, определяющий конфигурацию исходного языка, добавленный в версии 1.8.0.
class SourceLanguageRecognizer Класс для распознавителей исходного языка. Этот класс можно использовать для автономного обнаружения языка. См. эту страницу , добавленную в версии 1.17.0.
class SpeechConfig Класс, определяющий конфигурации для распознавания речи и намерений или синтеза речи.
class SpeechRecognitionCanceledEventArgs Класс для аргументов отмененного события распознавания речи.
class SpeechRecognitionEventArgs Класс для аргументов событий распознавания речи.
class SpeechRecognitionModel Сведения о модели распознавания речи.
класс SpeechRecognitionResult Базовый класс для результатов распознавания речи.
class SpeechRecognizer Класс для распознавителей речи.
class SpeechSynthesisBookmarkEventArgs Класс для аргументов события закладки синтеза речи. Добавлено в версии 1.16.0.
class SpeechSynthesisCancellationDetails Содержит подробные сведения о том, почему результат был отменен. Добавлено в версии 1.4.0.
class SpeechSynthesisEventArgs Класс для аргументов события синтеза речи. Добавлено в версии 1.4.0.
class SpeechSynthesisResult Содержит сведения о результатах синтеза текста в речь. Добавлено в версии 1.4.0.
class SpeechSynthesisVisemeEventArgs Класс для аргументов события виземы синтеза речи. Добавлено в версии 1.16.0.
class SpeechSynthesisWordBoundaryEventArgs Класс для аргументов события границы слова синтеза речи. Добавлено в версии 1.7.0.
class SpeechSynthesizer Класс для синтезатора речи. Обновлено в версии 1.14.0.
class SynthesisVoicesResult Содержит сведения о результатах из списка голосовых синтезаторов. Добавлено в версии 1.16.0.
класс VoiceInfo Содержит сведения о синтезе голосовых данных, обновленных в версии 1.17.0.

Элементы

enum PropertyId

Значения Описания
SpeechServiceConnection_Key Ключ подписки на службу распознавания речи Cognitive Services. Если вы используете распознаватель намерений, необходимо указать ключ конечной точки LUIS для конкретного приложения LUIS. В обычных обстоятельствах использовать это свойство напрямую не нужно. Вместо этого используйте SpeechConfig::FromSubscription.
SpeechServiceConnection_Endpoint Конечная точка службы распознавания речи Cognitive Services (URL-адрес). В обычных обстоятельствах использовать это свойство напрямую не нужно. Вместо этого используйте SpeechConfig::FromEndpoint. ПРИМЕЧАНИЕ. Эта конечная точка отличается от конечной точки, используемой для получения маркера доступа.
SpeechServiceConnection_Region Регион службы распознавания речи Cognitive Services. В обычных обстоятельствах использовать это свойство напрямую не нужно. Вместо этого используйте SpeechConfig::FromSubscription, SpeechConfig::FromEndpoint, SpeechConfig::FromHost, SpeechConfig::FromAuthorizationToken.
SpeechServiceAuthorization_Token Маркер авторизации службы распознавания речи Cognitive Services (он же маркер доступа). В обычных обстоятельствах использовать это свойство напрямую не нужно. Вместо этого используйте SpeechConfig::FromAuthorizationToken, SpeechRecognizer::SetAuthorizationToken, IntentRecognizer::SetAuthorizationToken, TranslationRecognizer::SetAuthorizationToken.
SpeechServiceAuthorization_Type Тип авторизации Службы распознавания речи Cognitive Services. В настоящее время неиспользуется.
SpeechServiceConnection_EndpointId Идентификатор конечной точки пользовательской службы распознавания речи или пользовательской голосовой службы Cognitive Services. В обычных обстоятельствах использовать это свойство напрямую не нужно. Вместо этого используйте SpeechConfig::SetEndpointId. ПРИМЕЧАНИЕ. Идентификатор конечной точки доступен на пользовательском портале распознавания речи в разделе Сведения о конечной точке.
SpeechServiceConnection_Host Узел службы распознавания речи Cognitive Services (URL-адрес). В обычных обстоятельствах использовать это свойство напрямую не нужно. Вместо этого используйте SpeechConfig::FromHost.
SpeechServiceConnection_ProxyHostName Имя узла прокси-сервера, используемого для подключения к службе распознавания речи Cognitive Services. В обычных обстоятельствах использовать это свойство напрямую не нужно. Вместо этого используйте SpeechConfig::SetProxy. ПРИМЕЧАНИЕ. Этот идентификатор свойства был добавлен в версии 1.1.0.
SpeechServiceConnection_ProxyPort Порт прокси-сервера, используемый для подключения к службе распознавания речи Cognitive Services. В обычных обстоятельствах использовать это свойство напрямую не нужно. Вместо этого используйте SpeechConfig::SetProxy. ПРИМЕЧАНИЕ. Этот идентификатор свойства был добавлен в версии 1.1.0.
SpeechServiceConnection_ProxyUserName Имя пользователя прокси-сервера, используемого для подключения к службе распознавания речи Cognitive Services. В обычных обстоятельствах использовать это свойство напрямую не нужно. Вместо этого используйте SpeechConfig::SetProxy. ПРИМЕЧАНИЕ. Этот идентификатор свойства был добавлен в версии 1.1.0.
SpeechServiceConnection_ProxyPassword Пароль прокси-сервера, используемого для подключения к службе распознавания речи Cognitive Services. В обычных обстоятельствах использовать это свойство напрямую не нужно. Вместо этого используйте SpeechConfig::SetProxy. ПРИМЕЧАНИЕ. Этот идентификатор свойства был добавлен в версии 1.1.0.
SpeechServiceConnection_Url Строка URL-адреса, созданная на основе конфигурации речи. Это свойство предназначено для чтения. Пакет SDK использует его для внутренних целей. ПРИМЕЧАНИЕ. Добавлено в версии 1.5.0.
SpeechServiceConnection_TranslationToLanguages Список языков, разделенных запятыми, используемых в качестве целевых языков перевода. В обычных обстоятельствах использовать это свойство напрямую не нужно. Вместо этого используйте SpeechTranslationConfig::AddTargetLanguage и SpeechTranslationConfig::GetTargetLanguages.
SpeechServiceConnection_TranslationVoice Имя голоса службы "Текст в речь" в Cognitive Service. В обычных обстоятельствах использовать это свойство напрямую не нужно. Вместо этого используйте SpeechTranslationConfig::SetVoiceName. ПРИМЕЧАНИЕ. Допустимые голосовые имена можно найти здесь.
SpeechServiceConnection_TranslationFeatures Функции перевода. Для внутреннего использования.
SpeechServiceConnection_IntentRegion Регион службы Распознавание речи. В обычных обстоятельствах использовать это свойство напрямую не нужно. Вместо этого используйте LanguageUnderstandingModel.
SpeechServiceConnection_RecoMode Режим распознавания службы распознавания речи Cognitive Services. Может иметь значение "INTERACTIVE", "CONVERSATION", "DICTATION". Это свойство предназначено для чтения. Пакет SDK использует его для внутренних целей.
SpeechServiceConnection_RecoLanguage Распознаваемый язык (в формате BCP-47). В обычных обстоятельствах использовать это свойство напрямую не нужно. Вместо этого используйте SpeechConfig::SetSpeechRecognitionLanguage.
Speech_SessionId Идентификатор сеанса. Этот идентификатор является универсальным уникальным идентификатором (UUID), представляющим определенную привязку входного аудиопотока и базовый экземпляр распознавания речи, к которому он привязан. В обычных обстоятельствах использовать это свойство напрямую не нужно. Вместо этого используйте SessionEventArgs::SessionId.
SpeechServiceConnection_UserDefinedQueryParameters Параметры запроса, предоставляемые пользователями. Они будут переданы в службу в качестве параметров запроса URL-адреса. Добавлено в версии 1.5.0.
SpeechServiceConnection_RecoBackend Строка, указывающая серверную часть, используемую для распознавания речи; Допустимые параметры доступны в сети и в автономном режиме. В обычных условиях не следует использовать это свойство напрямую. В настоящее время параметр offline действителен только при использовании EmbeddedSpeechConfig. Добавлено в версии 1.19.0.
SpeechServiceConnection_RecoModelName Имя модели, используемой для распознавания речи. В обычных условиях не следует использовать это свойство напрямую. В настоящее время это допустимо только при использовании EmbeddedSpeechConfig. Добавлено в версии 1.19.0.
SpeechServiceConnection_RecoModelKey Ключ расшифровки модели, используемой для распознавания речи. В обычных условиях не следует использовать это свойство напрямую. В настоящее время это допустимо только при использовании EmbeddedSpeechConfig. Добавлено в версии 1.19.0.
SpeechServiceConnection_RecoModelIniFile Путь к ini-файлу модели, используемой для распознавания речи. В обычных условиях не следует использовать это свойство напрямую. В настоящее время это допустимо только при использовании EmbeddedSpeechConfig. Добавлено в версии 1.19.0.
SpeechServiceConnection_SynthLanguage Синтезированный язык (например, en-US) добавлен в версии 1.4.0.
SpeechServiceConnection_SynthVoice Имя голоса TTS, используемого для синтеза речи Добавлено в версии 1.4.0.
SpeechServiceConnection_SynthOutputFormat Строка для указания формата выходных аудиофайла TTS добавлена в версии 1.4.0.
SpeechServiceConnection_SynthEnableCompressedAudioTransmission Указывает, используется ли сжатый аудиоформат для передачи звука синтеза речи. Это свойство влияет только в том случае, если SpeechServiceConnection_SynthOutputFormat имеет формат PCM. Если это свойство не задано и GStreamer доступен, пакет SDK будет использовать сжатый формат для синтезированного звука и декодировать его. Для этого свойства можно задать значение false, чтобы использовать необработанный формат PCM для передачи по проводу. Добавлено в версии 1.16.0.
SpeechServiceConnection_SynthBackend Строка, указывающая серверную часть TTS; Допустимые параметры: в сети и в автономном режиме. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте EmbeddedSpeechConfig::FromPath или EmbeddedSpeechConfig::FromPaths , чтобы переключить серверную часть синтеза в автономный режим. Добавлено в версии 1.19.0.
SpeechServiceConnection_SynthOfflineDataPath Пути к файлам данных для подсистемы автономного синтеза; Допустимо только в том случае, если серверная часть синтеза находится в автономном режиме. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте EmbeddedSpeechConfig::FromPath или EmbeddedSpeechConfig::FromPaths. Добавлено в версии 1.19.0.
SpeechServiceConnection_SynthOfflineVoice Имя автономного голоса TTS, используемого для синтеза речи. В обычных условиях не следует использовать это свойство напрямую. Вместо этого используйте EmbeddedSpeechConfig::SetSpeechSynthesisVoice и EmbeddedSpeechConfig::GetSpeechSynthesisVoiceName. Добавлено в версии 1.19.0.
SpeechServiceConnection_SynthModelKey Ключ расшифровки голоса, который будет использоваться для синтеза речи. В обычных обстоятельствах не следует использовать это свойство напрямую. Вместо этого используйте EmbeddedSpeechConfig::SetSpeechSynthesisVoice. Добавлено в версии 1.19.0.
SpeechServiceConnection_VoicesListEndpoint Конечная точка API списка голосовых служб Cognitive Services (URL). В обычных обстоятельствах указывать это свойство не требуется, пакет SDK создаст его на основе региона, узла или конечной точки SpeechConfig. Добавлено в версии 1.16.0.
SpeechServiceConnection_InitialSilenceTimeoutMs Начальное время ожидания тишины (в миллисекундах), используемое службой. Добавлено в версии 1.5.0.
SpeechServiceConnection_EndSilenceTimeoutMs Значение времени ожидания завершения тишины (в миллисекундах), используемое службой. Добавлено в версии 1.5.0.
SpeechServiceConnection_EnableAudioLogging Логическое значение, указывающее, включено ли ведение журнала звука в службе. Добавлено в версии 1.5.0.
SpeechServiceConnection_LanguageIdMode Режим идентификатора языка подключения службы распознавания речи. Может иметь значение "AtStart" (по умолчанию) или "Continuous". См. документ по идентификации языка . Добавлено в версии 1.25.0.
SpeechServiceConnection_AutoDetectSourceLanguages Языки источника автоматического обнаружения, добавленные в версии 1.8.0.
SpeechServiceConnection_AutoDetectSourceLanguageResult Результат автоматического определения исходного языка добавлен в версии 1.8.0.
SpeechServiceResponse_RequestDetailedResultTrueFalse Запрошенный формат выходных данных ответа Службы распознавания речи Cognitive Services (простой или подробный). В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте SpeechConfig::SetOutputFormat.
SpeechServiceResponse_RequestProfanityFilterTrueFalse Запрошенный уровень ненормативной лексики ответа Службы распознавания речи Cognitive Services. В настоящее время не используется.
SpeechServiceResponse_ProfanityOption Запрошенный параметр ненормативной лексики ответа Службы распознавания речи Cognitive Services. Допустимые значения: masked, removed и raw. Добавлено в версии 1.5.0.
SpeechServiceResponse_PostProcessingOption Строковое значение, указывающее, какой параметр постобработки должен использоваться службой. Допустимые значения: TrueText. Добавлено в версии 1.5.0.
SpeechServiceResponse_RequestWordLevelTimestamps Логическое значение, указывающее, следует ли включать метки времени на уровне слов в результат ответа. Добавлено в версии 1.5.0.
SpeechServiceResponse_StablePartialResultThreshold Количество раз, когда слово должно быть в частичных результатах, которые должны быть возвращены. Добавлено в версии 1.5.0.
SpeechServiceResponse_OutputFormatOption Строковое значение, указывающее параметр формата вывода в результатах ответа. Только для внутреннего использования. Добавлено в версии 1.5.0.
SpeechServiceResponse_RequestSnr Логическое значение, указывающее, следует ли включать SNR (отношение сигнала к шуму) в результат отклика. Добавлено в версии 1.18.0.
SpeechServiceResponse_TranslationRequestStablePartialResult Логическое значение для запроса стабилизации частичных результатов перевода путем пропуска слов в конце. Добавлено в версии 1.5.0.
SpeechServiceResponse_RequestWordBoundary Логическое значение, указывающее, следует ли запрашивать события WordBoundary. Добавлено в версии 1.21.0.
SpeechServiceResponse_RequestPunctuationBoundary Логическое значение, указывающее, следует ли запрашивать границу препинания в событиях WordBoundary. Значение по умолчанию — true. Добавлено в версии 1.21.0.
SpeechServiceResponse_RequestSentenceBoundary Логическое значение, указывающее, следует ли запрашивать границу предложения в событиях WordBoundary. Значение по умолчанию — false. Добавлено в версии 1.21.0.
SpeechServiceResponse_JsonResult Выходные данные ответа Службы распознавания речи Cognitive Services (в формате JSON). Это свойство доступно только для объектов результатов распознавания.
SpeechServiceResponse_JsonErrorDetails Сведения об ошибке службы распознавания речи Cognitive Services (в формате JSON). В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте CancellationDetails::ErrorDetails.
SpeechServiceResponse_RecognitionLatencyMs Задержка распознавания в миллисекундах. Только для чтения, доступно для окончательных результатов распознавания речи, перевода и намерения. Это позволяет измерять задержку между получением аудиовхода пакетом SDK и моментом получения окончательного результата от службы. Пакет SDK вычисляет разницу во времени между последним звуковым фрагментом из входных аудиоданных, которые вносят свой вклад в окончательный результат, и временем получения окончательного результата от службы распознавания речи. Добавлено в версии 1.3.0.
SpeechServiceResponse_RecognitionBackend Серверная часть распознавания. Доступно только для чтения, доступно для результатов распознавания речи. Это указывает, использовалось ли для получения результата облачное (интерактивное) или внедренное (автономное) распознавание.
SpeechServiceResponse_SynthesisFirstByteLatencyMs Задержка первого байта синтеза речи в миллисекундах. Только для чтения, доступно для окончательных результатов синтеза речи. При этом измеряется задержка между началом обработки синтеза и моментом, когда будет доступен первый байт звука. Добавлено в версии 1.17.0.
SpeechServiceResponse_SynthesisFinishLatencyMs Задержка синтеза речи во всех байтах в миллисекундах. Только для чтения, доступно для окончательных результатов синтеза речи. Таким образом измеряется задержка между началом обработки синтеза и моментом синтеза всего звука. Добавлено в версии 1.17.0.
SpeechServiceResponse_SynthesisUnderrunTimeMs Время недостаточного выполнения синтеза речи в миллисекундах. Доступно только для чтения, доступно для результатов в событиях SynthesisCompleted. При этом измеряется общее время недостаточного выполнения из PropertyId::AudioConfig_PlaybackBufferLengthInMs заполнено до завершения синтеза. Добавлено в версии 1.17.0.
SpeechServiceResponse_SynthesisConnectionLatencyMs Задержка подключения синтеза речи в миллисекундах. Только для чтения, доступно для окончательных результатов синтеза речи. При этом измеряется задержка между началом обработки синтеза и моментом установления соединения HTTP/WebSocket. Добавлено в версии 1.26.0.
SpeechServiceResponse_SynthesisNetworkLatencyMs Задержка сети синтеза речи в миллисекундах. Только для чтения, доступно для окончательных результатов синтеза речи. Это позволяет измерять время кругового пути сети. Добавлено в версии 1.26.0.
SpeechServiceResponse_SynthesisServiceLatencyMs Задержка службы синтеза речи в миллисекундах. Только для чтения, доступно для окончательных результатов синтеза речи. Он измеряет время обработки службы для синтеза первого байта звука. Добавлено в версии 1.26.0.
SpeechServiceResponse_SynthesisBackend Указывает, с помощью какой серверной части завершается синтез. Доступно только для чтения, доступно для результатов синтеза речи, за исключением результата в событии SynthesisStarted Добавлено в версии 1.17.0.
CancellationDetails_Reason Причина отмены. В настоящее время не используется.
CancellationDetails_ReasonText Текст отмены. В настоящее время не используется.
CancellationDetails_ReasonDetailedText Подробный текст отмены. В настоящее время не используется.
LanguageUnderstandingServiceResponse_JsonResult Выходные данные ответа службы Распознавание речи (в формате JSON). Доступно через IntentRecognitionResult.Properties.
AudioConfig_DeviceNameForCapture Имя устройства для записи звука. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте AudioConfig::FromMicrophoneInput. ПРИМЕЧАНИЕ. Этот идентификатор свойства был добавлен в версии 1.3.0.
AudioConfig_NumberOfChannelsForCapture Количество каналов для захвата звука. Только для внутреннего использования. ПРИМЕЧАНИЕ. Этот идентификатор свойства был добавлен в версии 1.3.0.
AudioConfig_SampleRateForCapture Частота дискретизации (в Гц) для записи звука. Только для внутреннего использования. ПРИМЕЧАНИЕ. Этот идентификатор свойства был добавлен в версии 1.3.0.
AudioConfig_BitsPerSampleForCapture Количество битов каждой выборки для захвата звука. Только для внутреннего использования. ПРИМЕЧАНИЕ. Этот идентификатор свойства был добавлен в версии 1.3.0.
AudioConfig_AudioSource Источник звука. Допустимые значения: "Микрофоны", "Файл" и "Поток". Добавлено в версии 1.3.0.
AudioConfig_DeviceNameForRender Имя устройства для отрисовки звука. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте AudioConfig::FromSpeakerOutput. Добавлено в версии 1.14.0.
AudioConfig_PlaybackBufferLengthInMs Длина буфера воспроизведения в миллисекундах, по умолчанию — 50 миллисекундах.
AudioConfig_AudioProcessingOptions Параметры обработки звука в формате JSON.
Speech_LogFilename Имя файла для записи журналов. Добавлено в версии 1.4.0.
Speech_SegmentationSilenceTimeoutMs Продолжительность обнаруженного молчания, измеряемая в миллисекундах, после которой преобразование речи в текст определяет окончание произнесенной фразы и создает окончательный результат Распознавание. Настройка этого времени ожидания может быть полезна в ситуациях, когда речевой ввод выполняется значительно быстрее или медленнее, чем обычно, а поведение сегментации по умолчанию постоянно дает слишком длинные или слишком короткие результаты. Значения времени ожидания сегментации, которые являются неприемлемо высокими или низкими, могут негативно повлиять на точность преобразования речи в текст; Это свойство должно быть тщательно настроено, а результирующее поведение должно быть тщательно проверено должным образом.
Conversation_ApplicationId Идентификатор, используемый для подключения к серверной службе. Добавлено в версии 1.5.0.
Conversation_DialogType Тип серверной части диалогового окна для подключения. Добавлено в версии 1.7.0.
Conversation_Initial_Silence_Timeout Время ожидания тишины для прослушивания добавлено в версии 1.5.0.
Conversation_From_Id От идентификатора для использования в действиях распознавания речи добавлено в версии 1.5.0.
Conversation_Conversation_Id ConversationId для сеанса. Добавлено в версии 1.8.0.
Conversation_Custom_Voice_Deployment_Ids Разделенный запятыми список идентификаторов развертывания пользовательской голосовой связи. Добавлено в версии 1.8.0.
Conversation_Speech_Activity_Template Шаблон действия "Речь", метка свойств в шаблоне действия, созданного службой для речи. Добавлено в версии 1.10.0.
Conversation_ParticipantId Идентификатор участника в текущей беседе. Добавлено в версии 1.13.0.
Conversation_Request_Bot_Status_Messages
Conversation_Connection_Id
DataBuffer_TimeStamp Метка времени, связанная с буфером данных, записанным клиентом при использовании входных аудиопотоков по запросу и отправке. Метка времени представляет собой 64-разрядное значение с разрешением 90 кГц. Это то же самое, что и метка времени презентации в транспортном потоке MPEG. См https://en.wikipedia.org/wiki/Presentation_timestamp . раздел Добавлено в версии 1.5.0.
DataBuffer_UserId Идентификатор пользователя, связанный с буфером данных, записанным клиентом при использовании входных аудиопотоков по запросу и отправке. Добавлено в версии 1.5.0.
PronunciationAssessment_ReferenceText Ссылочный текст звука для оценки произношения. Дополнительные сведения об этом и следующих параметрах оценки произношения см https://docs.microsoft.com/azure/cognitive-services/speech-service/rest-speech-to-text#pronunciation-assessment-parameters . в этой статье. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте PronunciationAssessmentConfig::Create или PronunciationAssessmentConfig::SetReferenceText. Добавлено в версии 1.14.0.
PronunciationAssessment_GradingSystem Система точек для калибровки оценок произношения (FivePoint или HundredMark). В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте PronunciationAssessmentConfig::Create. Добавлено в версии 1.14.0.
PronunciationAssessment_Granularity Степень детализации оценки произношения (Фонема, Word или FullText). В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте PronunciationAssessmentConfig::Create. Добавлено в версии 1.14.0.
PronunciationAssessment_EnableMiscue Определяет, включено ли вычисление ошибок. Если включен этот параметр, произнесенные слова сравниваются с эталонным текстом и по результатам сравнения отмечаются как пропуск или вставка. Значение по умолчанию — Нет. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте PronunciationAssessmentConfig::Create. Добавлено в версии 1.14.0.
PronunciationAssessment_PhonemeAlphabet Алфавит фонемы для оценки произношения. Допустимые значения: "SAPI" (по умолчанию) и "IPA". В обычных обстоятельствах вам не нужно использовать это свойство напрямую. Вместо этого используйте PronunciationAssessmentConfig::SetPhonemeAlphabet. Добавлено в версии 1.20.0.
PronunciationAssessment_NBestPhonemeCount Оценка произношения nbest фонемы. В обычных обстоятельствах не нужно использовать это свойство напрямую. Вместо этого используйте PronunciationAssessmentConfig::SetNBestPhonemeCount. Добавлено в версии 1.20.0.
PronunciationAssessment_Json Строка JSON параметров оценки произношения. В обычных условиях вам не нужно использовать это свойство напрямую. Вместо этого используйте PronunciationAssessmentConfig::Create. Добавлено в версии 1.14.0.
PronunciationAssessment_Params Параметры оценки произношения. Это свойство предназначено только для чтения. Пакет SDK использует его для внутренних целей. Добавлено в версии 1.14.0.
SpeakerRecognition_Api_Version Версия API серверной части распознавания говорящего. Это свойство добавлено, чтобы разрешить тестирование и использование предыдущих версий API распознавания говорящего, если это применимо. Добавлено в версии 1.18.0.

Определяет идентификаторы свойств речи. Изменено в версии 1.4.0.

enum OutputFormat

Значения Описания
Простая
Подробный

Формат вывода.

enum ProfanityOption

Значения Описания
Масках Заменяет буквы в ненормативных словах символами-звездами.
Удалено Удаляет ненормативные слова.
Raw Ничего не делает для ненормативной лексики.

Удаляет ненормативную лексику (ругательства) или заменяет буквы ненормативной лексики звездами. Добавлено в версии 1.5.0.

перечисление ResultReason

Значения Описания
NoMatch Указывает, что не удалось распознать речь. Дополнительные сведения можно найти в объекте NoMatchDetails.
Отменено Указывает, что распознавание было отменено. Дополнительные сведения можно найти с помощью объекта CancellationDetails.
RecognizedSpeech Указывает, что результат речи содержит текст гипотезы.
RecognizedSpeech Указывает, что результат распознавания речи содержит окончательный текст. Распознавание речи для этой фразы завершено.
Распознаваниеintent Указывает, что результат намерения содержит текст гипотезы и намерение.
RecognizedIntent Указывает, что результат намерения содержит окончательный текст и намерение. Распознавание речи и определение намерений теперь завершены для этой фразы.
TranslatingSpeech Указывает, что результат перевода содержит текст гипотезы и его переводы.
TranslatedSpeech Указывает, что результат перевода содержит окончательный текст и соответствующие переводы. Распознавание и перевод речи теперь завершены для этой фразы.
СинтезированиеAudio Указывает, что результат синтезированного звука содержит ненулевое количество звуковых данных.
СинтезированиеAudioCompleted Указывает, что синтезированный звук для этой фразы завершен.
RecognizedKeyword Указывает, что результат речи содержит (непроверенный) текст ключевого слова. Добавлено в версии 1.3.0.
RecognizedKeyword Указывает, что распознавание ключевых слов завершило распознавание заданного ключевого слова. Добавлено в версии 1.3.0.
СинтезированиеAudioStarted Указывает, что синтез речи запущен добавлен в версии 1.4.0.
TranslatingParticipantSpeech Указывает, что результат транскрибирования содержит текст гипотезы и его переводы для других участников беседы. Добавлено в версии 1.8.0.
TranslatedParticipantSpeech Указывает, что результат транскрибирования содержит окончательный текст и соответствующие переводы для других участников беседы. Распознавание и перевод речи теперь завершены для этой фразы. Добавлено в версии 1.8.0.
TranslatedInstantMessage Указывает, что результат транскрибирования содержит мгновенное сообщение и соответствующие переводы. Добавлено в версии 1.8.0.
TranslatedParticipantInstantMessage Указывает, что результат транскрибирования содержит мгновенное сообщение для других участников беседы и соответствующие переводы. Добавлено в версии 1.8.0.
EnrollingVoiceProfile Указывает, что выполняется регистрация голосового профиля, и клиентам необходимо отправить больше звука, чтобы создать голосовой профиль. Добавлено в версии 1.12.0.
EnrolledVoiceProfile Голосовой профиль зарегистрирован. Добавлено в версии 1.12.0.
RecognizedSpeakers Указывает на успешную идентификацию некоторых говорящих. Добавлено в версии 1.12.0.
RecognizedSpeaker Указывает, что один говорящий успешно проверен. Добавлено в версии 1.12.0.
ResetVoiceProfile Указывает, что голосовой профиль успешно сброшен. Добавлено в версии 1.12.0.
DeletedVoiceProfile Указывает, что голосовой профиль успешно удален. Добавлено в версии 1.12.0.
VoicesListRetrieved Указывает, что список голосов успешно получен. Добавлено в версии 1.16.0.

Указывает возможные причины, по которым может быть создан результат распознавания.

enum CancellationReason

Значения Описания
Ошибка Указывает, что во время распознавания речи произошла ошибка.
EndOfStream Указывает, что достигнут конец аудиопотока.
CancelledByUser Указывает, что запрос был отменен пользователем. Добавлено в версии 1.14.0.

Определяет возможные причины отмены результата распознавания.

enum CancellationErrorCode

Значения Описания
NoError Нет ошибки. Если CancellationReason имеет значение EndOfStream, cancellationErrorCode имеет значение NoError.
AuthenticationFailure Указывает на ошибку проверки подлинности. Ошибка проверки подлинности возникает, если ключ подписки или маркер авторизации являются недействительными, просроченными или не соответствуют используемому региону.
BadRequest Указывает, что один или несколько параметров распознавания недопустимы или аудиоформат не поддерживается.
TooManyRequests Указывает, что количество параллельных запросов превысило количество разрешенных одновременных транскрибирования для подписки.
Запрещено Указывает, что у бесплатной подписки, используемой запросом, закончилась квота.
ConnectionFailure Указывает на ошибку подключения.
ServiceTimeout Указывает на ошибку времени ожидания ответа от службы.
ServiceError Указывает, что служба возвращает ошибку.
ServiceUnavailable Указывает, что служба в настоящее время недоступна.
RuntimeError Указывает на непредвиденное сообщение об ошибке среды выполнения.
ServiceRedirectTemporary Указывает, что служба "Речь" временно запрашивает повторное подключение к другой конечной точке.
ServiceRedirectPermanent Указывает, что служба "Речь" постоянно запрашивает повторное подключение к другой конечной точке.
EmbeddedModelError Указывает, что модель встроенной речи (SR или TTS) недоступна или повреждена.

Определяет код ошибки в случае, если CancellationReason имеет значение Error. Добавлено в версии 1.1.0.

enum NoMatchReason

Значения Описания
Неопознано Указывает, что речь была обнаружена, но не распознана.
InitialSilenceTimeout Указывает, что начало аудиопотока содержало только тишину, а время ожидания службы истекло.
InitialBabbleTimeout Указывает, что запуск аудиопотока содержал только шум, а время ожидания службы истекло.
KeywordNotRecognized Указывает, что обнаруженное ключевое слово было отклонено службой проверки ключевых слов. Добавлено в версии 1.5.0.

Определяет возможные причины, по которым не распознается результат распознавания.

enum ActivityJSONType

Значения Описания
Null
Объект
Array
Строка
Double
UInt
Int
Логическое

Определяет возможные типы для значения JSON действия. Добавлено в версии 1.5.0.

enum SpeechSynthesisOutputFormat

Значения Описания
Raw8Khz8BitMonoMULaw raw-8khz-8bit-mono-mulaw
Riff16Khz16KbpsMonoSiren riff-16khz-16kbps-mono-siren не поддерживается службой. Не используйте это значение.
Audio16Khz16KbpsMonoSiren audio-16khz-16kbps-mono-siren не поддерживается службой. Не используйте это значение.
Audio16Khz32KBitRateMonoMp3 audio-16khz-32kbitrate-mono-mp3
Audio16Khz128KBitRateMonoMp3 audio-16khz-128kbitrate-mono-mp3
Audio16Khz64KBitRateMonoMp3 audio-16khz-64kbitrate-mono-mp3
Audio24Khz48KBitRateMonoMp3 audio-24khz-48kbitrate-mono-mp3
Audio24Khz96KBitRateMonoMp3 audio-24khz-96kbitrate-mono-mp3
Audio24Khz160KBitRateMonoMp3 audio-24khz-160kbitrate-mono-mp3
Raw16Khz16BitMonoTrueSilk raw-16khz-16bit-mono-truesilk
Riff16Khz16BitMonoPcm riff-16khz-16bit-mono-pcm
Riff8Khz16BitMonoPcm riff-8khz-16bit-mono-pcm
Riff24Khz16BitMonoPcm riff-24khz-16bit-mono-pcm
Riff8Khz8BitMonoMULaw riff-8khz-8bit-mono-mulaw
Raw16Khz16BitMonoPcm raw-16khz-16bit-mono-pcm
Raw24Khz16BitMonoPcm raw-24khz-16bit-mono-pcm
Raw8Khz16BitMonoPcm raw-8khz-16bit-mono-pcm
Ogg16Khz16BitMonoOpus ogg-16khz-16bit-mono-opus
Ogg24Khz16BitMonoOpus ogg-24khz-16bit-mono-opus
Raw48Khz16BitMonoPcm raw-48khz-16bit-mono-pcm
Riff48Khz16BitMonoPcm riff-48khz-16bit-mono-pcm
Audio48Khz96KBitRateMonoMp3 audio-48khz-96kbitrate-mono-mp3
Audio48Khz192KBitRateMonoMp3 audio-48khz-192kbitrate-mono-mp3
Ogg48Khz16BitMonoOpus ogg-48khz-16bit-mono-opus добавлено в версии 1.16.0
Webm16Khz16BitMonoOpus webm-16khz-16bit-mono-opus добавлен в версию 1.16.0
Webm24Khz16BitMonoOpus webm-24khz-16bit-mono-opus добавлено в версии 1.16.0
Raw24Khz16BitMonoTrueSilk raw-24khz-16bit-mono-truesilk, добавленный в версии 1.17.0
Raw8Khz8BitMonoALaw raw-8khz-8bit-mono-alaw Добавлено в версии 1.17.0
Riff8Khz8BitMonoALaw riff-8khz-8bit-mono-alaw Добавлено в версии 1.17.0
Webm24Khz16Bit24KbpsMonoOpus webm-24khz-16bit-24kbps-mono-opus Audio, сжатый кодеком OPUS в контейнере WebM со скоростью 24 кбит/с, оптимизированный для сценария Интернета вещей. (Добавлено в версии 1.19.0)
Audio16Khz16Bit32KbpsMonoOpus audio-16khz-16bit-32kbps-mono-opus Аудио, сжатый кодеком OPUS без контейнера, со скоростью 32 кбит/с. (Добавлено в версии 1.20.0)
Audio24Khz16Bit48KbpsMonoOpus audio-24khz-16bit-48kbps-mono-opus Аудио, сжатый кодеком OPUS без контейнера, со скоростью 48 кбит/с. (Добавлено в версии 1.20.0)
Audio24Khz16Bit24KbpsMonoOpus audio-24khz-16bit-24kbps-mono-opus Аудио, сжатый кодек OPUS без контейнера, со скоростью 24 кбит/с. (Добавлено в версии 1.20.0)
Raw22050Hz16BitMonoPcm raw-22050hz-16bit-mono-pcm Raw PCM audio с частотой дискретизации 22050 Гц и 16-битной глубиной. (Добавлено в версии 1.22.0)
Riff22050Hz16BitMonoPcm riff-22050hz-16bit-mono-pcm PCM аудио с частотой выборки 22050 Гц и глубиной 16 бит с заголовком RIFF. (Добавлено в версии 1.22.0)
Raw44100Hz16BitMonoPcm raw-44100hz-16bit-mono-pcm Raw PCM audio с частотой дискретизации 44100 Гц и 16-битной глубиной. (Добавлено в версии 1.22.0)
Riff44100Hz16BitMonoPcm riff-44100hz-16bit-mono-pcm PCM audio с частотой выборки 44100 Гц и глубиной 16 бит, с заголовком RIFF. (Добавлено в версии 1.22.0)
AmrWb16000Hz amr-wb-16000hz AMR-WB audio с частотой дискретизации 16 кГц. (Добавлено в версии 1.24.0)

Определяет возможные форматы выходных аудиоданных синтеза речи. Обновлено в версии 1.19.0.

enum StreamStatus

Значения Описания
Неизвестно Состояние потока аудиоданных неизвестно.
Nodata Поток аудиоданных не содержит данных.
PartialData Поток аудиоданных содержит частичные данные запроса на речь.
AllData Поток звуковых данных содержит все данные запроса на речь.
Отменено Поток аудиоданных был отменен.

Определяет возможное состояние потока аудиоданных. Добавлено в версии 1.4.0.

enum ServicePropertyChannel

Значения Описания
UriQueryParameter Использует параметр запроса URI для передачи параметров свойств в службу.
HttpHeader Использует HttpHeader для задания ключа или значения в заголовке HTTP.

Определяет каналы, используемые для передачи параметров свойств в службу. Добавлено в версии 1.5.0.

enum VoiceProfileType

Значения Описания
TextIndependentIdentification Идентификация независимо от текста говорящего.
TextDependentVerification Проверка говорящего, зависящего от текста.
TextIndependentVerification Независимая от текста проверка.

Определяет типы голосовых профилей.

enum RecognitionFactorScope

Значения Описания
PartialPhrase Коэффициент распознавания будет применяться к грамматикам, на которые можно ссылаться как на отдельные частичные фразы.

Определяет область, к которому применяется коэффициент распознавания.

enum PronunciationAssessmentGradingSystem

Значения Описания
FivePoint Калибровка с пятью точками.
HundredMark Сто марок.

Определяет систему точек для калибровки оценки произношения; Значение по умолчанию — FivePoint. Добавлено в версии 1.14.0.

enum PronunciationAssessmentGranularity

Значения Описания
Фонема Показывает оценку на уровне полнотекстового текста, слова и фонемы.
Word Показывает оценку на уровне полнотекстового текста и слов.
FullText Показывает оценку только на уровне полнотекстового текста.

Определяет степень детализации оценки произношения; Значение по умолчанию — Phoneme. Добавлено в версии 1.14.0.

enum SynthesisVoiceType

Значения Описания
OnlineNeural Нейронный голос в сети.
OnlineStandard Стандартная онлайн-голосовая связь.
OfflineNeural Автономный нейронный голос.
OfflineStandard Автономная стандартная голосовая связь.

Определяет тип голосов синтеза, добавленных в версии 1.16.0.

enum SynthesisVoiceGender

Значения Описания
Неизвестно Пол неизвестен.
Жен. Женский голос.
Муж. Мужской голос.

Определяет пол голосов синтеза, добавленных в версии 1.17.0.

enum SpeechSynthesisBoundaryType

Значения Описания
Word Граница слова.
Пунктуация Граница препинания.
предложение. Граница предложения.

Определяет тип границы события границ синтеза речи, добавленного в версии 1.21.0.