speech Пакет

Ссылка

Microsoft Speech SDK для Python

Модули

audio	Классы, связанные с обработкой аудиовхода в различные распознаватель и аудиовыходом синтезатора речи.
dialog	Классы, связанные с соединителем службы диалогов.
enums	Microsoft Speech SDK для Python
intent	Классы, связанные с распознаванием намерений из речи.
interop	Microsoft Speech SDK для Python
languageconfig	Классы, связанные с обработкой языковых конфигураций
properties	Microsoft Speech SDK для Python
speech	Классы, связанные с распознаванием текста из речи, синтезированием речи из текста, и общие классы, используемые в различных распознавателях.
transcription	Классы, связанные с транскрибированием бесед.
translation	Классы, связанные с переводом речи на другие языки.
version	Microsoft Speech SDK для Python

Классы

AudioDataStream	Представляет поток аудиоданных, используемый для работы с звуковыми данными в виде потока. Создает поток аудиоданных из результата синтеза речи (тип SpeechSynthesisResult) или результата распознавания ключевое слово (тип KeywordRecognitionResult).
AutoDetectSourceLanguageResult	Представляет результат языка источника автоматического обнаружения. Результат можно инициализировать из результата распознавания речи.
CancellationDetails	Microsoft Speech SDK для Python
Connection	Класс proxy для управления подключением к службе распознавания речи указанного Recognizerобъекта . По умолчанию Recognizer при необходимости автономно управляет подключением к службе. Класс Connection предоставляет пользователям дополнительные методы для явного открытия или закрытия подключения, а также для подписки на изменения состояния подключения. Использовать Connection необязательно. Он предназначен для сценариев, в которых требуется точная настройка поведения приложения на основе состояния подключения. При необходимости пользователи могут вызвать open метод, чтобы вручную инициировать подключение к службе перед запуском распознавания в объекте , связанном Recognizer с данным объектом Connection. После запуска распознавания вызов open или close может завершиться ошибкой. Это не повлияет на Распознаватель или текущее распознавание. По разным причинам подключение может прервать. Распознаватель всегда будет пытаться повторно установить подключение по мере необходимости, чтобы гарантировать выполнение текущих операций. Во всех этих случаях connected/disconnected события указывают на изменение состояния подключения. Примечание Обновлено в версии 1.17.0. Конструктор для внутреннего использования.
ConnectionEventArgs	Предоставляет данные для ConnectionEvent. Примечание Добавлено в версии 1.2.0 Конструктор для внутреннего использования.
EventSignal	Клиенты могут подключаться к сигналу события для получения событий или отключаться от сигнала события, чтобы прекратить получение событий. Конструктор для внутреннего использования.
KeywordRecognitionEventArgs	Класс для аргументов события распознавания ключевое слово. Конструктор для внутреннего использования.
KeywordRecognitionModel	Представляет модель распознавания ключевое слово.
KeywordRecognitionResult	Результат операции распознавания ключевое слово. Конструктор для внутреннего использования.
KeywordRecognizer	Распознаватель ключевое слово.
NoMatchDetails	Microsoft Speech SDK для Python
PhraseListGrammar	Класс, позволяющий во время выполнения добавлять подсказки фраз, чтобы помочь в распознавании речи. Фразы, добавленные в распознаватель, действуют в начале следующего распознавания или при следующем подключении распознавателя речи к службе распознавания речи. Примечание Добавлено в версии 1.5.0. Конструктор для внутреннего использования.
PronunciationAssessmentConfig	Представляет конфигурацию оценки произношения Примечание Добавлено в версии 1.14.0. Конфигурацию можно инициализировать двумя способами: из параметров: передача ссылочного текста, система оценки, степень детализации, включение miscue и идентификатор сценария. из json: передача строки JSON Подробные сведения о параметрах см. в разделе https://docs.microsoft.com/azure/cognitive-services/speech-service/rest-speech-to-text#pronunciation-assessment-parameters
PronunciationAssessmentPhonemeResult	Содержит результат оценки произношения на уровне фонемы Примечание Добавлено в версии 1.14.0.
PronunciationAssessmentResult	Представляет результат оценки произношения. Примечание Добавлено в версии 1.14.0. Результат можно инициализировать из результата распознавания речи.
PronunciationAssessmentWordResult	Содержит результат оценки произношения на уровне слов. Примечание Добавлено в версии 1.14.0.
PropertyCollection	Класс для получения или задания значения свойства из коллекции свойств.
RecognitionEventArgs	Предоставляет данные для RecognitionEvent. Конструктор для внутреннего использования.
RecognitionResult	Подробные сведения о результате операции распознавания. Конструктор для внутреннего использования.
Recognizer	Базовый класс для разных распознавителей
ResultFuture	Результат асинхронной операции. частный конструктор
SessionEventArgs	Базовый класс для аргументов события сеанса. Конструктор для внутреннего использования.
SourceLanguageRecognizer	Распознаватель исходного языка ( автономный распознаватель языков) можно использовать для обнаружения одного языка или непрерывного распознавания языка. Примечание Добавлено в версии 1.18.0.
SpeechConfig	Класс, определяющий конфигурации для распознавания речи и намерений и синтеза речи. Конфигурацию можно инициализировать разными способами: из подписки: передайте ключ подписки и регион из конечной точки: передайте конечную точку. Ключ подписки или маркер авторизации являются необязательными. с узла: передайте адрес узла. Ключ подписки или маркер авторизации являются необязательными. из маркера авторизации: передача маркера авторизации и региона
SpeechRecognitionCanceledEventArgs	Класс для аргументов отмененного события распознавания речи. Конструктор для внутреннего использования.
SpeechRecognitionEventArgs	Класс для аргументов событий распознавания речи. Конструктор для внутреннего использования.
SpeechRecognitionResult	Базовый класс для результатов распознавания речи. Конструктор для внутреннего использования.
SpeechRecognizer	Распознаватель речи. Если вам нужно указать сведения об исходном языке, укажите только один из этих трех параметров: язык, source_language_config или auto_detect_source_language_config.
SpeechSynthesisBookmarkEventArgs	Класс для аргументов события закладки синтеза речи. Примечание Добавлено в версии 1.16.0. Конструктор для внутреннего использования.
SpeechSynthesisCancellationDetails	Содержит подробные сведения о том, почему результат был отменен.
SpeechSynthesisEventArgs	Класс для аргументов события синтеза речи. Конструктор для внутреннего использования.
SpeechSynthesisResult	Результат операции синтеза речи. Конструктор для внутреннего использования.
SpeechSynthesisVisemeEventArgs	Класс для аргументов события виземы синтеза речи. Примечание Добавлено в версии 1.16.0. Конструктор для внутреннего использования.
SpeechSynthesisWordBoundaryEventArgs	Класс для аргументов события границы слова синтеза речи. Примечание Обновлено в версии 1.21.0. Конструктор для внутреннего использования.
SpeechSynthesizer	Синтезатор речи.
SyllableLevelTimingResult	Содержит результат времени на уровне слога Примечание Добавлено в версии 1.20.0.
SynthesisVoicesResult	Содержит подробные сведения о полученном списке голосов синтеза. Примечание Добавлено в версии 1.16.0. Конструктор для внутреннего использования.
VoiceInfo	Содержит подробные сведения о синтезе голосовых данных. Примечание Обновлено в версии 1.17.0. Конструктор для внутреннего использования.

Перечисления

AudioStreamContainerFormat	Определяет поддерживаемый формат контейнера аудиопотока.
AudioStreamWaveFormat	Представляет формат, указанный в контейнере WAV.
CancellationErrorCode	Определяет код ошибки в случае, если CancellationReason имеет значение Error.
CancellationReason	Определяет возможные причины отмены результата распознавания.
NoMatchReason	Определяет возможные причины, по которым не распознается результат распознавания.
OutputFormat	Формат вывода.
ProfanityOption	Удаляет ненормативную лексику (ругательства) или заменяет буквы ненормативной лексики звездами.
PronunciationAssessmentGradingSystem	Определяет систему точек для калибровки показателей произношения; значение по умолчанию — FivePoint.
PronunciationAssessmentGranularity	Определяет степень детализации оценки произношения; Значение по умолчанию — Phoneme.
PropertyId	Определяет идентификаторы свойств речи.
ResultReason	Указывает возможные причины, по которым может быть создан результат распознавания.
ServicePropertyChannel	Определяет каналы, используемые для передачи параметров свойств в службу.
SpeechSynthesisOutputFormat	Определяет возможные форматы выходных аудиофайлов синтеза речи.
StreamStatus	Определяет возможное состояние потока аудиоданных.
SynthesisVoiceGender	Определяет пол голосов синтеза
SynthesisVoiceType	Определяет тип голосов синтеза

speech Пакет

Модули

Классы

Перечисления

Обратная связь

Дополнительные ресурсы