microsoft-cognitiveservices-speech-sdk package

Классы

ActivityReceivedEventArgs

Определяет содержимое полученных сообщений и событий.

AudioConfig

Представляет конфигурацию входных звуковых данных, используемую для указания типа входных данных (микрофон, файл, поток).

AudioInputStream

Представляет входной аудиопоток, используемый для пользовательских конфигураций входных аудиоданных.

AudioOutputStream

Представляет поток вывода звука, используемый для пользовательских конфигураций вывода звука.

AudioStreamFormat

Представляет формат аудиопотока, используемый для пользовательских конфигураций входных аудиоданных.

AutoDetectSourceLanguageConfig

Настройка автоматического определения языка.

AutoDetectSourceLanguageResult

Формат вывода

AvatarConfig

Определяет конфигурацию говорящая аватара.

AvatarEventArgs

Определяет содержимое для говорящих событий аватара.

AvatarSynthesizer

Определяет синтезатор аватаров.

AvatarVideoFormat

Определяет формат выходного видео аватара.

AvatarWebRTCConnectionResult

Определяет результат подключения WebRTC аватара.

BaseAudioPlayer

Базовый класс аудиопроигрывателя TODO: сейчас воспроизводит только PCM.

BotFrameworkConfig

Класс, определяющий конфигурации для объекта соединителя службы диалогов для использования серверной части Bot Framework.

CancellationDetails

Содержит подробные сведения о том, почему результат был отменен.

CancellationDetailsBase

Содержит подробные сведения о том, почему результат был отменен.

Connection

Connection — это прокси-класс для управления подключением к службе распознавания речи указанного распознавателя. По умолчанию Распознаватель автономно управляет подключением к службе при необходимости. Класс Connection предоставляет пользователям дополнительные методы для явного открытия или закрытия подключения и подписки на изменения состояния подключения. Подключение является необязательным и главным образом для сценариев, в которых требуется точная настройка поведения приложения на основе состояния подключения. При необходимости пользователи могут вызвать Open(), чтобы вручную настроить подключение, прежде чем начать распознавание распознавателя, связанного с этим подключением. Если Распознаватель должен подключиться к службе или отключиться от него, он самостоятельно настроит или завершит работу подключения. В этом случае подключение будет уведомлено об изменении состояния подключения через события "Подключено/ отключено". Добавлено в версии 1.2.1.

ConnectionEventArgs

Определяет полезные данные для событий подключения, таких как Connected/Disconnected. Добавлено в версии 1.2.0

ConnectionMessage

ConnectionMessage представляет сообщения для конкретной реализации, отправляемые в службу распознавания речи и полученные от нее. Эти сообщения предоставляются в целях отладки и не должны использоваться в рабочих сценариях использования службы "Речь" Azure Cognitive Services. Сообщения, отправленные в службу "Речь" и полученные из нее, могут изменяться без предварительного уведомления. Сюда входит содержимое сообщений, заголовки, полезные данные, порядок и т. д. Добавлено в версии 1.11.0.

ConnectionMessageEventArgs
Conversation
ConversationExpirationEventArgs

Определяет содержимое для событий сеанса, таких как SessionStarted/Stopped, SoundStarted/Stopped.

ConversationParticipantsChangedEventArgs

Определяет содержимое для событий сеанса, таких как SessionStarted/Stopped, SoundStarted/Stopped.

ConversationTranscriber

Выполняет распознавание речи с разделением динамиков от микрофона, файла или других входных аудиопотоков и получает в результате транскрибированный текст.

ConversationTranscriptionCanceledEventArgs

Определяет содержимое события RecognitionErrorEvent.

ConversationTranscriptionEventArgs

Определяет содержимое события транскрибирования или транскрибирования беседы.

ConversationTranscriptionResult

Определяет результат транскрибирования бесед.

ConversationTranslationCanceledEventArgs
ConversationTranslationEventArgs

Определяет полезные данные для событий сеанса, таких как обнаружение начала и окончания речи.

ConversationTranslationResult

Результат перевода текста.

ConversationTranslator

Присоединиться к беседе, выйти из нее или подключиться к ней.

Coordinate

Определяет координату в двухD-пространстве.

CustomCommandsConfig

Класс, определяющий конфигурации для объекта соединителя службы диалогов для использования серверной части CustomCommands.

Diagnostics

Определяет API диагностика для управления выходными данными консоли, добавленный в версии 1.21.0

DialogServiceConfig

Класс, определяющий базовые конфигурации для соединителя службы диалогов

DialogServiceConnector

Соединитель службы диалогов

IntentRecognitionCanceledEventArgs

Определите полезные данные событий отмененных результатов распознавания намерений.

IntentRecognitionEventArgs

Аргументы события результата распознавания намерений.

IntentRecognitionResult

Результат распознавания намерений.

IntentRecognizer

Распознаватель намерений.

KeywordRecognitionModel

Представляет модель распознавания ключевое слово для распознавания, когда пользователь произносит ключевое слово для запуска дальнейшего распознавания речи.

LanguageUnderstandingModel

Модель распознавания речи

Meeting
MeetingTranscriber
MeetingTranscriptionCanceledEventArgs

Определяет содержимое Объекта MeetingTranscriptionCanceledEvent.

MeetingTranscriptionEventArgs

Определяет содержимое события транскрибирования или транскрибирования собрания.

NoMatchDetails

Содержит подробные сведения о результатах распознавания NoMatch.

Participant

Представляет участника беседы. Добавлено в версии 1.4.0

PhraseListGrammar

Позволяет добавлять новые фразы для улучшения распознавания речи.

Фразы, добавленные в распознаватель, действуют в начале следующего распознавания или при следующем подключении SpeechSDK к службе распознавания речи.

PronunciationAssessmentConfig

Конфигурация оценки произношения.

PronunciationAssessmentResult

Результаты оценки произношения.

PropertyCollection

Представляет коллекцию свойств и их значений.

PullAudioInputStream

Представляет входной аудиопоток, используемый для пользовательских конфигураций входных аудиоданных.

PullAudioInputStreamCallback

Абстрактный базовый класс, определяющий методы обратного вызова (read() и close()) для пользовательских входных аудиопотоков).

PullAudioOutputStream

Представляет поток вывода звука push-уведомлений с поддержкой памяти, используемый для пользовательских конфигураций вывода звука.

PushAudioInputStream

Представляет поток входных звуковых данных push-уведомлений с поддержкой памяти, используемый для пользовательских конфигураций входных аудиоданных.

PushAudioOutputStream

Представляет поток вывода звука, используемый для пользовательских конфигураций вывода звука.

PushAudioOutputStreamCallback

Абстрактный базовый класс, определяющий методы обратного вызова (write() и close()) для пользовательских потоков вывода аудио).

RecognitionEventArgs

Определяет полезные данные для событий сеанса, таких как обнаружение начала и окончания речи.

RecognitionResult

Определяет результат распознавания речи.

Recognizer

Определяет распознаватель базового класса, который в основном содержит общие обработчики событий.

ServiceEventArgs

Определяет полезные данные для любого события сообщения службы, добавленного в версии 1.9.0

SessionEventArgs

Определяет содержимое для событий сеанса, таких как SessionStarted/Stopped, SoundStarted/Stopped.

SourceLanguageConfig

Конфигурация исходного языка.

SpeakerAudioDestination

Представляет место назначения воспроизведения звука в динамике, которое работает только в браузере. Примечание. Пакет SDK попытается использовать расширения источника мультимедиа для воспроизведения звука. Формат MP3 имеет лучшую поддержку в Microsoft Edge, Chrome и Safari (настольном компьютере), поэтому лучше указать формат MP3 для воспроизведения.

SpeakerIdentificationModel

Определяет класс SpeakerIdentificationModel для модели распознавания говорящего, содержащий набор профилей для идентификации говорящего.

SpeakerRecognitionCancellationDetails
SpeakerRecognitionResult

Формат вывода

SpeakerRecognizer

Определяет класс SpeakerRecognizer для операций распознавания говорящего Handles от пользователя для операций профиля голоса (например, createProfile, deleteProfile).

SpeakerVerificationModel

Определяет класс SpeakerVerificationModel для модели распознавания говорящего, содержащий профиль для проверки говорящего

SpeechConfig

Конфигурация службы "Речь".

SpeechConfigImpl
SpeechRecognitionCanceledEventArgs
SpeechRecognitionEventArgs

Определяет содержимое события распознавания и распознавания речи.

SpeechRecognitionResult

Определяет результат распознавания речи.

SpeechRecognizer

Выполняет распознавание речи с микрофона, файла или других входных аудиопотоков и получает в результате транскрибированный текст.

SpeechSynthesisBookmarkEventArgs

Определяет содержимое события закладки синтеза речи.

SpeechSynthesisEventArgs

Определяет содержимое событий синтеза речи.

SpeechSynthesisResult

Определяет результат синтеза речи.

SpeechSynthesisVisemeEventArgs

Определяет содержимое события виземы синтеза речи.

SpeechSynthesisWordBoundaryEventArgs

Определяет содержимое события границы слова синтеза речи.

SpeechSynthesizer

Определяет класс SpeechSynthesizer для преобразования текста в речь. Обновлено в версии 1.16.0

SpeechTranslationConfig

Конфигурация перевода речи.

SynthesisResult

Базовый класс для результатов синтеза

SynthesisVoicesResult

Определяет результат синтеза речи.

Synthesizer
TranslationRecognitionCanceledEventArgs

Определите полезные данные событий отмененных результатов распознавания речи.

TranslationRecognitionEventArgs

Аргументы события результата перевода текста.

TranslationRecognitionResult

Результат перевода текста.

TranslationRecognizer

Распознаватель перевода

TranslationSynthesisEventArgs

Аргументы события синтеза перевода

TranslationSynthesisResult

Определяет результат синтеза перевода, т. е. голосовые выходные данные переведенного текста на целевом языке.

Translations

Представляет коллекцию параметров и их значений.

TurnStatusReceivedEventArgs

Определяет содержимое полученных сообщений и событий.

User
VoiceInfo

Сведения о голосе синтеза речи, добавленные в версии 1.20.0.

VoiceProfile

Определяет класс профиля голоса для распознавания говорящего

VoiceProfileCancellationDetails
VoiceProfileClient

Определяет класс VoiceProfileClient для операций дескрипторов распознавания говорящего от пользователя для операций профиля голоса (например, createProfile, deleteProfile).

VoiceProfileEnrollmentCancellationDetails
VoiceProfileEnrollmentResult

Формат вывода

VoiceProfilePhraseResult

Формат вывода

VoiceProfileResult

Формат вывода

Интерфейсы

CancellationEventArgs
ConversationInfo
IParticipant

Представляет участника беседы. Добавлено в версии 1.4.0

IPlayer

Представляет интерфейс аудиопроигрывтеля для управления воспроизведением звука, например приостановкой, возобновлением и т. д.

MeetingInfo
VoiceSignature

Перечисления

AudioFormatTag
CancellationErrorCode

Определяет код ошибки в случае, если CancellationReason имеет значение Error. Добавлено в версии 1.1.0.

CancellationReason

Определяет возможные причины отмены результата распознавания.

LanguageIdMode

Режим идентификации языка

LogLevel
NoMatchReason

Определяет возможные причины, по которым результат распознавания может не распознаться.

OutputFormat

Определение форматов выходных данных Распознавателя речи.

ParticipantChangedReason
ProfanityOption

Параметр ненормативной лексики. Добавлено в версии 1.7.0.

PronunciationAssessmentGradingSystem

Определяет систему точек для калибровки оценки произношения; Значение по умолчанию — FivePoint. Добавлено в версии 1.15.0

PronunciationAssessmentGranularity

Определяет степень детализации оценки произношения; Значение по умолчанию — Phoneme. Добавлено в версии 1.15.0

PropertyId

Определяет идентификаторы свойств речи.

ResultReason

Определяет возможные причины, по которым может быть создан результат распознавания.

ServicePropertyChannel

Определяет каналы, используемые для передачи параметров свойств в службу. Добавлено в версии 1.7.0.

SpeakerRecognitionResultType
SpeechSynthesisBoundaryType

Определяет тип границы события границ синтеза речи.

SpeechSynthesisOutputFormat

Определите форматы выходных аудиоданных синтеза речи. SpeechSynthesisOutputFormat обновлено в версии 1.17.0

VoiceProfileType

Формат вывода