microsoft-cognitiveservices-speech-sdk package
Классы
ActivityReceivedEventArgs |
Определяет содержимое полученных сообщений и событий. |
AudioConfig |
Представляет конфигурацию входных звуковых данных, используемую для указания типа входных данных (микрофон, файл, поток). |
AudioInputStream |
Представляет входной аудиопоток, используемый для пользовательских конфигураций входных аудиоданных. |
AudioOutputStream |
Представляет поток вывода звука, используемый для пользовательских конфигураций вывода звука. |
AudioStreamFormat |
Представляет формат аудиопотока, используемый для пользовательских конфигураций входных аудиоданных. |
AutoDetectSourceLanguageConfig |
Настройка автоматического определения языка. |
AutoDetectSourceLanguageResult |
Формат вывода |
AvatarConfig |
Определяет конфигурацию говорящая аватара. |
AvatarEventArgs |
Определяет содержимое для говорящих событий аватара. |
AvatarSynthesizer |
Определяет синтезатор аватаров. |
AvatarVideoFormat |
Определяет формат выходного видео аватара. |
AvatarWebRTCConnectionResult |
Определяет результат подключения WebRTC аватара. |
BaseAudioPlayer |
Базовый класс аудиопроигрывателя TODO: сейчас воспроизводит только PCM. |
BotFrameworkConfig |
Класс, определяющий конфигурации для объекта соединителя службы диалогов для использования серверной части Bot Framework. |
CancellationDetails |
Содержит подробные сведения о том, почему результат был отменен. |
CancellationDetailsBase |
Содержит подробные сведения о том, почему результат был отменен. |
Connection |
Connection — это прокси-класс для управления подключением к службе распознавания речи указанного распознавателя. По умолчанию Распознаватель автономно управляет подключением к службе при необходимости. Класс Connection предоставляет пользователям дополнительные методы для явного открытия или закрытия подключения и подписки на изменения состояния подключения. Подключение является необязательным и главным образом для сценариев, в которых требуется точная настройка поведения приложения на основе состояния подключения. При необходимости пользователи могут вызвать Open(), чтобы вручную настроить подключение, прежде чем начать распознавание распознавателя, связанного с этим подключением. Если Распознаватель должен подключиться к службе или отключиться от него, он самостоятельно настроит или завершит работу подключения. В этом случае подключение будет уведомлено об изменении состояния подключения через события "Подключено/ отключено". Добавлено в версии 1.2.1. |
ConnectionEventArgs |
Определяет полезные данные для событий подключения, таких как Connected/Disconnected. Добавлено в версии 1.2.0 |
ConnectionMessage |
ConnectionMessage представляет сообщения для конкретной реализации, отправляемые в службу распознавания речи и полученные от нее. Эти сообщения предоставляются в целях отладки и не должны использоваться в рабочих сценариях использования службы "Речь" Azure Cognitive Services. Сообщения, отправленные в службу "Речь" и полученные из нее, могут изменяться без предварительного уведомления. Сюда входит содержимое сообщений, заголовки, полезные данные, порядок и т. д. Добавлено в версии 1.11.0. |
ConnectionMessageEventArgs | |
Conversation | |
ConversationExpirationEventArgs |
Определяет содержимое для событий сеанса, таких как SessionStarted/Stopped, SoundStarted/Stopped. |
ConversationParticipantsChangedEventArgs |
Определяет содержимое для событий сеанса, таких как SessionStarted/Stopped, SoundStarted/Stopped. |
ConversationTranscriber |
Выполняет распознавание речи с разделением динамиков от микрофона, файла или других входных аудиопотоков и получает в результате транскрибированный текст. |
ConversationTranscriptionCanceledEventArgs |
Определяет содержимое события RecognitionErrorEvent. |
ConversationTranscriptionEventArgs |
Определяет содержимое события транскрибирования или транскрибирования беседы. |
ConversationTranscriptionResult |
Определяет результат транскрибирования бесед. |
ConversationTranslationCanceledEventArgs | |
ConversationTranslationEventArgs |
Определяет полезные данные для событий сеанса, таких как обнаружение начала и окончания речи. |
ConversationTranslationResult |
Результат перевода текста. |
ConversationTranslator |
Присоединиться к беседе, выйти из нее или подключиться к ней. |
Coordinate |
Определяет координату в двухD-пространстве. |
CustomCommandsConfig |
Класс, определяющий конфигурации для объекта соединителя службы диалогов для использования серверной части CustomCommands. |
Diagnostics |
Определяет API диагностика для управления выходными данными консоли, добавленный в версии 1.21.0 |
DialogServiceConfig |
Класс, определяющий базовые конфигурации для соединителя службы диалогов |
DialogServiceConnector |
Соединитель службы диалогов |
IntentRecognitionCanceledEventArgs |
Определите полезные данные событий отмененных результатов распознавания намерений. |
IntentRecognitionEventArgs |
Аргументы события результата распознавания намерений. |
IntentRecognitionResult |
Результат распознавания намерений. |
IntentRecognizer |
Распознаватель намерений. |
KeywordRecognitionModel |
Представляет модель распознавания ключевое слово для распознавания, когда пользователь произносит ключевое слово для запуска дальнейшего распознавания речи. |
LanguageUnderstandingModel |
Модель распознавания речи |
Meeting | |
MeetingTranscriber | |
MeetingTranscriptionCanceledEventArgs |
Определяет содержимое Объекта MeetingTranscriptionCanceledEvent. |
MeetingTranscriptionEventArgs |
Определяет содержимое события транскрибирования или транскрибирования собрания. |
NoMatchDetails |
Содержит подробные сведения о результатах распознавания NoMatch. |
Participant |
Представляет участника беседы. Добавлено в версии 1.4.0 |
PhraseListGrammar |
Позволяет добавлять новые фразы для улучшения распознавания речи. Фразы, добавленные в распознаватель, действуют в начале следующего распознавания или при следующем подключении SpeechSDK к службе распознавания речи. |
PronunciationAssessmentConfig |
Конфигурация оценки произношения. |
PronunciationAssessmentResult |
Результаты оценки произношения. |
PropertyCollection |
Представляет коллекцию свойств и их значений. |
PullAudioInputStream |
Представляет входной аудиопоток, используемый для пользовательских конфигураций входных аудиоданных. |
PullAudioInputStreamCallback |
Абстрактный базовый класс, определяющий методы обратного вызова (read() и close()) для пользовательских входных аудиопотоков). |
PullAudioOutputStream |
Представляет поток вывода звука push-уведомлений с поддержкой памяти, используемый для пользовательских конфигураций вывода звука. |
PushAudioInputStream |
Представляет поток входных звуковых данных push-уведомлений с поддержкой памяти, используемый для пользовательских конфигураций входных аудиоданных. |
PushAudioOutputStream |
Представляет поток вывода звука, используемый для пользовательских конфигураций вывода звука. |
PushAudioOutputStreamCallback |
Абстрактный базовый класс, определяющий методы обратного вызова (write() и close()) для пользовательских потоков вывода аудио). |
RecognitionEventArgs |
Определяет полезные данные для событий сеанса, таких как обнаружение начала и окончания речи. |
RecognitionResult |
Определяет результат распознавания речи. |
Recognizer |
Определяет распознаватель базового класса, который в основном содержит общие обработчики событий. |
ServiceEventArgs |
Определяет полезные данные для любого события сообщения службы, добавленного в версии 1.9.0 |
SessionEventArgs |
Определяет содержимое для событий сеанса, таких как SessionStarted/Stopped, SoundStarted/Stopped. |
SourceLanguageConfig |
Конфигурация исходного языка. |
SpeakerAudioDestination |
Представляет место назначения воспроизведения звука в динамике, которое работает только в браузере. Примечание. Пакет SDK попытается использовать расширения источника мультимедиа для воспроизведения звука. Формат MP3 имеет лучшую поддержку в Microsoft Edge, Chrome и Safari (настольном компьютере), поэтому лучше указать формат MP3 для воспроизведения. |
SpeakerIdentificationModel |
Определяет класс SpeakerIdentificationModel для модели распознавания говорящего, содержащий набор профилей для идентификации говорящего. |
SpeakerRecognitionCancellationDetails | |
SpeakerRecognitionResult |
Формат вывода |
SpeakerRecognizer |
Определяет класс SpeakerRecognizer для операций распознавания говорящего Handles от пользователя для операций профиля голоса (например, createProfile, deleteProfile). |
SpeakerVerificationModel |
Определяет класс SpeakerVerificationModel для модели распознавания говорящего, содержащий профиль для проверки говорящего |
SpeechConfig |
Конфигурация службы "Речь". |
SpeechConfigImpl | |
SpeechRecognitionCanceledEventArgs | |
SpeechRecognitionEventArgs |
Определяет содержимое события распознавания и распознавания речи. |
SpeechRecognitionResult |
Определяет результат распознавания речи. |
SpeechRecognizer |
Выполняет распознавание речи с микрофона, файла или других входных аудиопотоков и получает в результате транскрибированный текст. |
SpeechSynthesisBookmarkEventArgs |
Определяет содержимое события закладки синтеза речи. |
SpeechSynthesisEventArgs |
Определяет содержимое событий синтеза речи. |
SpeechSynthesisResult |
Определяет результат синтеза речи. |
SpeechSynthesisVisemeEventArgs |
Определяет содержимое события виземы синтеза речи. |
SpeechSynthesisWordBoundaryEventArgs |
Определяет содержимое события границы слова синтеза речи. |
SpeechSynthesizer |
Определяет класс SpeechSynthesizer для преобразования текста в речь. Обновлено в версии 1.16.0 |
SpeechTranslationConfig |
Конфигурация перевода речи. |
SynthesisResult |
Базовый класс для результатов синтеза |
SynthesisVoicesResult |
Определяет результат синтеза речи. |
Synthesizer | |
TranslationRecognitionCanceledEventArgs |
Определите полезные данные событий отмененных результатов распознавания речи. |
TranslationRecognitionEventArgs |
Аргументы события результата перевода текста. |
TranslationRecognitionResult |
Результат перевода текста. |
TranslationRecognizer |
Распознаватель перевода |
TranslationSynthesisEventArgs |
Аргументы события синтеза перевода |
TranslationSynthesisResult |
Определяет результат синтеза перевода, т. е. голосовые выходные данные переведенного текста на целевом языке. |
Translations |
Представляет коллекцию параметров и их значений. |
TurnStatusReceivedEventArgs |
Определяет содержимое полученных сообщений и событий. |
User | |
VoiceInfo |
Сведения о голосе синтеза речи, добавленные в версии 1.20.0. |
VoiceProfile |
Определяет класс профиля голоса для распознавания говорящего |
VoiceProfileCancellationDetails | |
VoiceProfileClient |
Определяет класс VoiceProfileClient для операций дескрипторов распознавания говорящего от пользователя для операций профиля голоса (например, createProfile, deleteProfile). |
VoiceProfileEnrollmentCancellationDetails | |
VoiceProfileEnrollmentResult |
Формат вывода |
VoiceProfilePhraseResult |
Формат вывода |
VoiceProfileResult |
Формат вывода |
Интерфейсы
CancellationEventArgs | |
ConversationInfo | |
IParticipant |
Представляет участника беседы. Добавлено в версии 1.4.0 |
IPlayer |
Представляет интерфейс аудиопроигрывтеля для управления воспроизведением звука, например приостановкой, возобновлением и т. д. |
IVoiceJson | |
MeetingInfo | |
VoiceSignature |
Перечисления
AudioFormatTag | |
CancellationErrorCode |
Определяет код ошибки в случае, если CancellationReason имеет значение Error. Добавлено в версии 1.1.0. |
CancellationReason |
Определяет возможные причины отмены результата распознавания. |
LanguageIdMode |
Режим идентификации языка |
LogLevel | |
NoMatchReason |
Определяет возможные причины, по которым результат распознавания может не распознаться. |
OutputFormat |
Определение форматов выходных данных Распознавателя речи. |
ParticipantChangedReason | |
ProfanityOption |
Параметр ненормативной лексики. Добавлено в версии 1.7.0. |
PronunciationAssessmentGradingSystem |
Определяет систему точек для калибровки оценки произношения; Значение по умолчанию — FivePoint. Добавлено в версии 1.15.0 |
PronunciationAssessmentGranularity |
Определяет степень детализации оценки произношения; Значение по умолчанию — Phoneme. Добавлено в версии 1.15.0 |
PropertyId |
Определяет идентификаторы свойств речи. |
ResultReason |
Определяет возможные причины, по которым может быть создан результат распознавания. |
ServicePropertyChannel |
Определяет каналы, используемые для передачи параметров свойств в службу. Добавлено в версии 1.7.0. |
SpeakerRecognitionResultType | |
SpeechSynthesisBoundaryType |
Определяет тип границы события границ синтеза речи. |
SpeechSynthesisOutputFormat |
Определите форматы выходных аудиоданных синтеза речи. SpeechSynthesisOutputFormat обновлено в версии 1.17.0 |
VoiceProfileType |
Формат вывода |