speech Пакет
Microsoft Speech SDK для Python
Модули
audio |
Классы, связанные с обработкой аудиовхода в различные распознаватель и аудиовыходом синтезатора речи. |
dialog |
Классы, связанные с соединителем службы диалогов. |
enums |
Microsoft Speech SDK для Python |
intent |
Классы, связанные с распознаванием намерений из речи. |
interop |
Microsoft Speech SDK для Python |
languageconfig |
Классы, связанные с обработкой языковых конфигураций |
properties |
Microsoft Speech SDK для Python |
speech |
Классы, связанные с распознаванием текста из речи, синтезированием речи из текста, и общие классы, используемые в различных распознавателях. |
transcription |
Классы, связанные с транскрибированием бесед. |
translation |
Классы, связанные с переводом речи на другие языки. |
version |
Microsoft Speech SDK для Python |
Классы
AudioDataStream |
Представляет поток аудиоданных, используемый для работы с звуковыми данными в виде потока. Создает поток аудиоданных из результата синтеза речи (тип SpeechSynthesisResult) или результата распознавания ключевое слово (тип KeywordRecognitionResult). |
AutoDetectSourceLanguageResult |
Представляет результат языка источника автоматического обнаружения. Результат можно инициализировать из результата распознавания речи. |
CancellationDetails |
Microsoft Speech SDK для Python |
Connection |
Класс proxy для управления подключением к службе распознавания речи указанного Recognizerобъекта . По умолчанию Recognizer при необходимости автономно управляет подключением к службе. Класс Connection предоставляет пользователям дополнительные методы для явного открытия или закрытия подключения, а также для подписки на изменения состояния подключения. Использовать Connection необязательно. Он предназначен для сценариев, в которых требуется точная настройка поведения приложения на основе состояния подключения. При необходимости пользователи могут вызвать open метод, чтобы вручную инициировать подключение к службе перед запуском распознавания в объекте , связанном Recognizer с данным объектом Connection. После запуска распознавания вызов open или close может завершиться ошибкой. Это не повлияет на Распознаватель или текущее распознавание. По разным причинам подключение может прервать. Распознаватель всегда будет пытаться повторно установить подключение по мере необходимости, чтобы гарантировать выполнение текущих операций. Во всех этих случаях connected/disconnected события указывают на изменение состояния подключения. Примечание Обновлено в версии 1.17.0. Конструктор для внутреннего использования. |
ConnectionEventArgs |
Предоставляет данные для ConnectionEvent. Примечание Добавлено в версии 1.2.0 Конструктор для внутреннего использования. |
EventSignal |
Клиенты могут подключаться к сигналу события для получения событий или отключаться от сигнала события, чтобы прекратить получение событий. Конструктор для внутреннего использования. |
KeywordRecognitionEventArgs |
Класс для аргументов события распознавания ключевое слово. Конструктор для внутреннего использования. |
KeywordRecognitionModel |
Представляет модель распознавания ключевое слово. |
KeywordRecognitionResult |
Результат операции распознавания ключевое слово. Конструктор для внутреннего использования. |
KeywordRecognizer |
Распознаватель ключевое слово. |
NoMatchDetails |
Microsoft Speech SDK для Python |
PhraseListGrammar |
Класс, позволяющий во время выполнения добавлять подсказки фраз, чтобы помочь в распознавании речи. Фразы, добавленные в распознаватель, действуют в начале следующего распознавания или при следующем подключении распознавателя речи к службе распознавания речи. Примечание Добавлено в версии 1.5.0. Конструктор для внутреннего использования. |
PronunciationAssessmentConfig |
Представляет конфигурацию оценки произношения Примечание Добавлено в версии 1.14.0. Конфигурацию можно инициализировать двумя способами:
Подробные сведения о параметрах см. в разделе https://docs.microsoft.com/azure/cognitive-services/speech-service/rest-speech-to-text#pronunciation-assessment-parameters |
PronunciationAssessmentPhonemeResult |
Содержит результат оценки произношения на уровне фонемы Примечание Добавлено в версии 1.14.0. |
PronunciationAssessmentResult |
Представляет результат оценки произношения. Примечание Добавлено в версии 1.14.0. Результат можно инициализировать из результата распознавания речи. |
PronunciationAssessmentWordResult |
Содержит результат оценки произношения на уровне слов. Примечание Добавлено в версии 1.14.0. |
PropertyCollection |
Класс для получения или задания значения свойства из коллекции свойств. |
RecognitionEventArgs |
Предоставляет данные для RecognitionEvent. Конструктор для внутреннего использования. |
RecognitionResult |
Подробные сведения о результате операции распознавания. Конструктор для внутреннего использования. |
Recognizer |
Базовый класс для разных распознавителей |
ResultFuture |
Результат асинхронной операции. частный конструктор |
SessionEventArgs |
Базовый класс для аргументов события сеанса. Конструктор для внутреннего использования. |
SourceLanguageRecognizer |
Распознаватель исходного языка ( автономный распознаватель языков) можно использовать для обнаружения одного языка или непрерывного распознавания языка. Примечание Добавлено в версии 1.18.0. |
SpeechConfig |
Класс, определяющий конфигурации для распознавания речи и намерений и синтеза речи. Конфигурацию можно инициализировать разными способами:
|
SpeechRecognitionCanceledEventArgs |
Класс для аргументов отмененного события распознавания речи. Конструктор для внутреннего использования. |
SpeechRecognitionEventArgs |
Класс для аргументов событий распознавания речи. Конструктор для внутреннего использования. |
SpeechRecognitionResult |
Базовый класс для результатов распознавания речи. Конструктор для внутреннего использования. |
SpeechRecognizer |
Распознаватель речи. Если вам нужно указать сведения об исходном языке, укажите только один из этих трех параметров: язык, source_language_config или auto_detect_source_language_config. |
SpeechSynthesisBookmarkEventArgs |
Класс для аргументов события закладки синтеза речи. Примечание Добавлено в версии 1.16.0. Конструктор для внутреннего использования. |
SpeechSynthesisCancellationDetails |
Содержит подробные сведения о том, почему результат был отменен. |
SpeechSynthesisEventArgs |
Класс для аргументов события синтеза речи. Конструктор для внутреннего использования. |
SpeechSynthesisResult |
Результат операции синтеза речи. Конструктор для внутреннего использования. |
SpeechSynthesisVisemeEventArgs |
Класс для аргументов события виземы синтеза речи. Примечание Добавлено в версии 1.16.0. Конструктор для внутреннего использования. |
SpeechSynthesisWordBoundaryEventArgs |
Класс для аргументов события границы слова синтеза речи. Примечание Обновлено в версии 1.21.0. Конструктор для внутреннего использования. |
SpeechSynthesizer |
Синтезатор речи. |
SyllableLevelTimingResult |
Содержит результат времени на уровне слога Примечание Добавлено в версии 1.20.0. |
SynthesisVoicesResult |
Содержит подробные сведения о полученном списке голосов синтеза. Примечание Добавлено в версии 1.16.0. Конструктор для внутреннего использования. |
VoiceInfo |
Содержит подробные сведения о синтезе голосовых данных. Примечание Обновлено в версии 1.17.0. Конструктор для внутреннего использования. |
Перечисления
AudioStreamContainerFormat |
Определяет поддерживаемый формат контейнера аудиопотока. |
AudioStreamWaveFormat |
Представляет формат, указанный в контейнере WAV. |
CancellationErrorCode |
Определяет код ошибки в случае, если CancellationReason имеет значение Error. |
CancellationReason |
Определяет возможные причины отмены результата распознавания. |
NoMatchReason |
Определяет возможные причины, по которым не распознается результат распознавания. |
OutputFormat |
Формат вывода. |
ProfanityOption |
Удаляет ненормативную лексику (ругательства) или заменяет буквы ненормативной лексики звездами. |
PronunciationAssessmentGradingSystem |
Определяет систему точек для калибровки показателей произношения; значение по умолчанию — FivePoint. |
PronunciationAssessmentGranularity |
Определяет степень детализации оценки произношения; Значение по умолчанию — Phoneme. |
PropertyId |
Определяет идентификаторы свойств речи. |
ResultReason |
Указывает возможные причины, по которым может быть создан результат распознавания. |
ServicePropertyChannel |
Определяет каналы, используемые для передачи параметров свойств в службу. |
SpeechSynthesisOutputFormat |
Определяет возможные форматы выходных аудиофайлов синтеза речи. |
StreamStatus |
Определяет возможное состояние потока аудиоданных. |
SynthesisVoiceGender |
Определяет пол голосов синтеза |
SynthesisVoiceType |
Определяет тип голосов синтеза |
Azure SDK for Python
Обратная связь
https://aka.ms/ContentUserFeedback.
Ожидается в ближайшее время: в течение 2024 года мы постепенно откажемся от GitHub Issues как механизма обратной связи для контента и заменим его новой системой обратной связи. Дополнительные сведения см. в разделеОтправить и просмотреть отзыв по