microsoft-cognitiveservices-speech-sdk package

Ссылка

Классы

ActivityReceivedEventArgs	Определяет содержимое полученных сообщений и событий.
AudioConfig	Представляет конфигурацию входных звуковых данных, используемую для указания типа входных данных (микрофон, файл, поток).
AudioInputStream	Представляет входной аудиопоток, используемый для пользовательских конфигураций входных аудиоданных.
AudioOutputStream	Представляет поток вывода звука, используемый для пользовательских конфигураций вывода звука.
AudioStreamFormat	Представляет формат аудиопотока, используемый для пользовательских конфигураций входных аудиоданных.
AutoDetectSourceLanguageConfig	Настройка автоматического определения языка.
AutoDetectSourceLanguageResult	Формат вывода
AvatarConfig	Определяет конфигурацию говорящая аватара.
AvatarEventArgs	Определяет содержимое для говорящих событий аватара.
AvatarSynthesizer	Определяет синтезатор аватаров.
AvatarVideoFormat	Определяет формат выходного видео аватара.
AvatarWebRTCConnectionResult	Определяет результат подключения WebRTC аватара.
BaseAudioPlayer	Базовый класс аудиопроигрывателя TODO: сейчас воспроизводит только PCM.
BotFrameworkConfig	Класс, определяющий конфигурации для объекта соединителя службы диалогов для использования серверной части Bot Framework.
CancellationDetails	Содержит подробные сведения о том, почему результат был отменен.
CancellationDetailsBase	Содержит подробные сведения о том, почему результат был отменен.
Connection	Connection — это прокси-класс для управления подключением к службе распознавания речи указанного распознавателя. По умолчанию Распознаватель автономно управляет подключением к службе при необходимости. Класс Connection предоставляет пользователям дополнительные методы для явного открытия или закрытия подключения и подписки на изменения состояния подключения. Подключение является необязательным и главным образом для сценариев, в которых требуется точная настройка поведения приложения на основе состояния подключения. При необходимости пользователи могут вызвать Open(), чтобы вручную настроить подключение, прежде чем начать распознавание распознавателя, связанного с этим подключением. Если Распознаватель должен подключиться к службе или отключиться от него, он самостоятельно настроит или завершит работу подключения. В этом случае подключение будет уведомлено об изменении состояния подключения через события "Подключено/ отключено". Добавлено в версии 1.2.1.
ConnectionEventArgs	Определяет полезные данные для событий подключения, таких как Connected/Disconnected. Добавлено в версии 1.2.0
ConnectionMessage	ConnectionMessage представляет сообщения для конкретной реализации, отправляемые в службу распознавания речи и полученные от нее. Эти сообщения предоставляются в целях отладки и не должны использоваться в рабочих сценариях использования службы "Речь" Azure Cognitive Services. Сообщения, отправленные в службу "Речь" и полученные из нее, могут изменяться без предварительного уведомления. Сюда входит содержимое сообщений, заголовки, полезные данные, порядок и т. д. Добавлено в версии 1.11.0.
ConnectionMessageEventArgs
Conversation
ConversationExpirationEventArgs	Определяет содержимое для событий сеанса, таких как SessionStarted/Stopped, SoundStarted/Stopped.
ConversationParticipantsChangedEventArgs	Определяет содержимое для событий сеанса, таких как SessionStarted/Stopped, SoundStarted/Stopped.
ConversationTranscriber	Выполняет распознавание речи с разделением динамиков от микрофона, файла или других входных аудиопотоков и получает в результате транскрибированный текст.
ConversationTranscriptionCanceledEventArgs	Определяет содержимое события RecognitionErrorEvent.
ConversationTranscriptionEventArgs	Определяет содержимое события транскрибирования или транскрибирования беседы.
ConversationTranscriptionResult	Определяет результат транскрибирования бесед.
ConversationTranslationCanceledEventArgs
ConversationTranslationEventArgs	Определяет полезные данные для событий сеанса, таких как обнаружение начала и окончания речи.
ConversationTranslationResult	Результат перевода текста.
ConversationTranslator	Присоединиться к беседе, выйти из нее или подключиться к ней.
Coordinate	Определяет координату в двухD-пространстве.
CustomCommandsConfig	Класс, определяющий конфигурации для объекта соединителя службы диалогов для использования серверной части CustomCommands.
Diagnostics	Определяет API диагностика для управления выходными данными консоли, добавленный в версии 1.21.0
DialogServiceConfig	Класс, определяющий базовые конфигурации для соединителя службы диалогов
DialogServiceConnector	Соединитель службы диалогов
IntentRecognitionCanceledEventArgs	Определите полезные данные событий отмененных результатов распознавания намерений.
IntentRecognitionEventArgs	Аргументы события результата распознавания намерений.
IntentRecognitionResult	Результат распознавания намерений.
IntentRecognizer	Распознаватель намерений.
KeywordRecognitionModel	Представляет модель распознавания ключевое слово для распознавания, когда пользователь произносит ключевое слово для запуска дальнейшего распознавания речи.
LanguageUnderstandingModel	Модель распознавания речи
Meeting
MeetingTranscriber
MeetingTranscriptionCanceledEventArgs	Определяет содержимое Объекта MeetingTranscriptionCanceledEvent.
MeetingTranscriptionEventArgs	Определяет содержимое события транскрибирования или транскрибирования собрания.
NoMatchDetails	Содержит подробные сведения о результатах распознавания NoMatch.
Participant	Представляет участника беседы. Добавлено в версии 1.4.0
PhraseListGrammar	Позволяет добавлять новые фразы для улучшения распознавания речи. Фразы, добавленные в распознаватель, действуют в начале следующего распознавания или при следующем подключении SpeechSDK к службе распознавания речи.
PronunciationAssessmentConfig	Конфигурация оценки произношения.
PronunciationAssessmentResult	Результаты оценки произношения.
PropertyCollection	Представляет коллекцию свойств и их значений.
PullAudioInputStream	Представляет входной аудиопоток, используемый для пользовательских конфигураций входных аудиоданных.
PullAudioInputStreamCallback	Абстрактный базовый класс, определяющий методы обратного вызова (read() и close()) для пользовательских входных аудиопотоков).
PullAudioOutputStream	Представляет поток вывода звука push-уведомлений с поддержкой памяти, используемый для пользовательских конфигураций вывода звука.
PushAudioInputStream	Представляет поток входных звуковых данных push-уведомлений с поддержкой памяти, используемый для пользовательских конфигураций входных аудиоданных.
PushAudioOutputStream	Представляет поток вывода звука, используемый для пользовательских конфигураций вывода звука.
PushAudioOutputStreamCallback	Абстрактный базовый класс, определяющий методы обратного вызова (write() и close()) для пользовательских потоков вывода аудио).
RecognitionEventArgs	Определяет полезные данные для событий сеанса, таких как обнаружение начала и окончания речи.
RecognitionResult	Определяет результат распознавания речи.
Recognizer	Определяет распознаватель базового класса, который в основном содержит общие обработчики событий.
ServiceEventArgs	Определяет полезные данные для любого события сообщения службы, добавленного в версии 1.9.0
SessionEventArgs	Определяет содержимое для событий сеанса, таких как SessionStarted/Stopped, SoundStarted/Stopped.
SourceLanguageConfig	Конфигурация исходного языка.
SpeakerAudioDestination	Представляет место назначения воспроизведения звука в динамике, которое работает только в браузере. Примечание. Пакет SDK попытается использовать расширения источника мультимедиа для воспроизведения звука. Формат MP3 имеет лучшую поддержку в Microsoft Edge, Chrome и Safari (настольном компьютере), поэтому лучше указать формат MP3 для воспроизведения.
SpeakerIdentificationModel	Определяет класс SpeakerIdentificationModel для модели распознавания говорящего, содержащий набор профилей для идентификации говорящего.
SpeakerRecognitionCancellationDetails
SpeakerRecognitionResult	Формат вывода
SpeakerRecognizer	Определяет класс SpeakerRecognizer для операций распознавания говорящего Handles от пользователя для операций профиля голоса (например, createProfile, deleteProfile).
SpeakerVerificationModel	Определяет класс SpeakerVerificationModel для модели распознавания говорящего, содержащий профиль для проверки говорящего
SpeechConfig	Конфигурация службы "Речь".
SpeechConfigImpl
SpeechRecognitionCanceledEventArgs
SpeechRecognitionEventArgs	Определяет содержимое события распознавания и распознавания речи.
SpeechRecognitionResult	Определяет результат распознавания речи.
SpeechRecognizer	Выполняет распознавание речи с микрофона, файла или других входных аудиопотоков и получает в результате транскрибированный текст.
SpeechSynthesisBookmarkEventArgs	Определяет содержимое события закладки синтеза речи.
SpeechSynthesisEventArgs	Определяет содержимое событий синтеза речи.
SpeechSynthesisResult	Определяет результат синтеза речи.
SpeechSynthesisVisemeEventArgs	Определяет содержимое события виземы синтеза речи.
SpeechSynthesisWordBoundaryEventArgs	Определяет содержимое события границы слова синтеза речи.
SpeechSynthesizer	Определяет класс SpeechSynthesizer для преобразования текста в речь. Обновлено в версии 1.16.0
SpeechTranslationConfig	Конфигурация перевода речи.
SynthesisResult	Базовый класс для результатов синтеза
SynthesisVoicesResult	Определяет результат синтеза речи.
Synthesizer
TranslationRecognitionCanceledEventArgs	Определите полезные данные событий отмененных результатов распознавания речи.
TranslationRecognitionEventArgs	Аргументы события результата перевода текста.
TranslationRecognitionResult	Результат перевода текста.
TranslationRecognizer	Распознаватель перевода
TranslationSynthesisEventArgs	Аргументы события синтеза перевода
TranslationSynthesisResult	Определяет результат синтеза перевода, т. е. голосовые выходные данные переведенного текста на целевом языке.
Translations	Представляет коллекцию параметров и их значений.
TurnStatusReceivedEventArgs	Определяет содержимое полученных сообщений и событий.
User
VoiceInfo	Сведения о голосе синтеза речи, добавленные в версии 1.20.0.
VoiceProfile	Определяет класс профиля голоса для распознавания говорящего
VoiceProfileCancellationDetails
VoiceProfileClient	Определяет класс VoiceProfileClient для операций дескрипторов распознавания говорящего от пользователя для операций профиля голоса (например, createProfile, deleteProfile).
VoiceProfileEnrollmentCancellationDetails
VoiceProfileEnrollmentResult	Формат вывода
VoiceProfilePhraseResult	Формат вывода
VoiceProfileResult	Формат вывода

Интерфейсы

CancellationEventArgs
ConversationInfo
IParticipant	Представляет участника беседы. Добавлено в версии 1.4.0
IPlayer	Представляет интерфейс аудиопроигрывтеля для управления воспроизведением звука, например приостановкой, возобновлением и т. д.
MeetingInfo
VoiceSignature

Перечисления

AudioFormatTag
CancellationErrorCode	Определяет код ошибки в случае, если CancellationReason имеет значение Error. Добавлено в версии 1.1.0.
CancellationReason	Определяет возможные причины отмены результата распознавания.
LanguageIdMode	Режим идентификации языка
LogLevel
NoMatchReason	Определяет возможные причины, по которым результат распознавания может не распознаться.
OutputFormat	Определение форматов выходных данных Распознавателя речи.
ParticipantChangedReason
ProfanityOption	Параметр ненормативной лексики. Добавлено в версии 1.7.0.
PronunciationAssessmentGradingSystem	Определяет систему точек для калибровки оценки произношения; Значение по умолчанию — FivePoint. Добавлено в версии 1.15.0
PronunciationAssessmentGranularity	Определяет степень детализации оценки произношения; Значение по умолчанию — Phoneme. Добавлено в версии 1.15.0
PropertyId	Определяет идентификаторы свойств речи.
ResultReason	Определяет возможные причины, по которым может быть создан результат распознавания.
ServicePropertyChannel	Определяет каналы, используемые для передачи параметров свойств в службу. Добавлено в версии 1.7.0.
SpeakerRecognitionResultType
SpeechSynthesisBoundaryType	Определяет тип границы события границ синтеза речи.
SpeechSynthesisOutputFormat	Определите форматы выходных аудиоданных синтеза речи. SpeechSynthesisOutputFormat обновлено в версии 1.17.0
VoiceProfileType	Формат вывода

microsoft-cognitiveservices-speech-sdk package

Классы

Интерфейсы

Перечисления

Дополнительные ресурсы