speech Пакет

Microsoft Speech SDK для Python

Модули

audio

Классы, связанные с обработкой аудиовхода в различные распознаватель и аудиовыходом синтезатора речи.

dialog

Классы, связанные с соединителем службы диалогов.

enums

Microsoft Speech SDK для Python

intent

Классы, связанные с распознаванием намерений из речи.

interop

Microsoft Speech SDK для Python

languageconfig

Классы, связанные с обработкой языковых конфигураций

properties

Microsoft Speech SDK для Python

speech

Классы, связанные с распознаванием текста из речи, синтезированием речи из текста, и общие классы, используемые в различных распознавателях.

transcription

Классы, связанные с транскрибированием бесед.

translation

Классы, связанные с переводом речи на другие языки.

version

Microsoft Speech SDK для Python

Классы

AudioDataStream

Представляет поток аудиоданных, используемый для работы с звуковыми данными в виде потока.

Создает поток аудиоданных из результата синтеза речи (тип SpeechSynthesisResult) или результата распознавания ключевое слово (тип KeywordRecognitionResult).

AutoDetectSourceLanguageResult

Представляет результат языка источника автоматического обнаружения.

Результат можно инициализировать из результата распознавания речи.

CancellationDetails

Microsoft Speech SDK для Python

Connection

Класс proxy для управления подключением к службе распознавания речи указанного Recognizerобъекта .

По умолчанию Recognizer при необходимости автономно управляет подключением к службе. Класс Connection предоставляет пользователям дополнительные методы для явного открытия или закрытия подключения, а также для подписки на изменения состояния подключения. Использовать Connection необязательно. Он предназначен для сценариев, в которых требуется точная настройка поведения приложения на основе состояния подключения. При необходимости пользователи могут вызвать open метод, чтобы вручную инициировать подключение к службе перед запуском распознавания в объекте , связанном Recognizer с данным объектом Connection. После запуска распознавания вызов open или close может завершиться ошибкой. Это не повлияет на Распознаватель или текущее распознавание. По разным причинам подключение может прервать. Распознаватель всегда будет пытаться повторно установить подключение по мере необходимости, чтобы гарантировать выполнение текущих операций. Во всех этих случаях connected/disconnected события указывают на изменение состояния подключения.

Примечание

Обновлено в версии 1.17.0.

Конструктор для внутреннего использования.

ConnectionEventArgs

Предоставляет данные для ConnectionEvent.

Примечание

Добавлено в версии 1.2.0

Конструктор для внутреннего использования.

EventSignal

Клиенты могут подключаться к сигналу события для получения событий или отключаться от сигнала события, чтобы прекратить получение событий.

Конструктор для внутреннего использования.

KeywordRecognitionEventArgs

Класс для аргументов события распознавания ключевое слово.

Конструктор для внутреннего использования.

KeywordRecognitionModel

Представляет модель распознавания ключевое слово.

KeywordRecognitionResult

Результат операции распознавания ключевое слово.

Конструктор для внутреннего использования.

KeywordRecognizer

Распознаватель ключевое слово.

NoMatchDetails

Microsoft Speech SDK для Python

PhraseListGrammar

Класс, позволяющий во время выполнения добавлять подсказки фраз, чтобы помочь в распознавании речи.

Фразы, добавленные в распознаватель, действуют в начале следующего распознавания или при следующем подключении распознавателя речи к службе распознавания речи.

Примечание

Добавлено в версии 1.5.0.

Конструктор для внутреннего использования.

PronunciationAssessmentConfig

Представляет конфигурацию оценки произношения

Примечание

Добавлено в версии 1.14.0.

Конфигурацию можно инициализировать двумя способами:

  • из параметров: передача ссылочного текста, система оценки, степень детализации, включение miscue и идентификатор сценария.

  • из json: передача строки JSON

Подробные сведения о параметрах см. в разделе https://docs.microsoft.com/azure/cognitive-services/speech-service/rest-speech-to-text#pronunciation-assessment-parameters

PronunciationAssessmentPhonemeResult

Содержит результат оценки произношения на уровне фонемы

Примечание

Добавлено в версии 1.14.0.

PronunciationAssessmentResult

Представляет результат оценки произношения.

Примечание

Добавлено в версии 1.14.0.

Результат можно инициализировать из результата распознавания речи.

PronunciationAssessmentWordResult

Содержит результат оценки произношения на уровне слов.

Примечание

Добавлено в версии 1.14.0.

PropertyCollection

Класс для получения или задания значения свойства из коллекции свойств.

RecognitionEventArgs

Предоставляет данные для RecognitionEvent.

Конструктор для внутреннего использования.

RecognitionResult

Подробные сведения о результате операции распознавания.

Конструктор для внутреннего использования.

Recognizer

Базовый класс для разных распознавителей

ResultFuture

Результат асинхронной операции.

частный конструктор

SessionEventArgs

Базовый класс для аргументов события сеанса.

Конструктор для внутреннего использования.

SourceLanguageRecognizer

Распознаватель исходного языка ( автономный распознаватель языков) можно использовать для обнаружения одного языка или непрерывного распознавания языка.

Примечание

Добавлено в версии 1.18.0.

SpeechConfig

Класс, определяющий конфигурации для распознавания речи и намерений и синтеза речи.

Конфигурацию можно инициализировать разными способами:

  • из подписки: передайте ключ подписки и регион

  • из конечной точки: передайте конечную точку. Ключ подписки или маркер авторизации являются необязательными.

  • с узла: передайте адрес узла. Ключ подписки или маркер авторизации являются необязательными.

  • из маркера авторизации: передача маркера авторизации и региона

SpeechRecognitionCanceledEventArgs

Класс для аргументов отмененного события распознавания речи.

Конструктор для внутреннего использования.

SpeechRecognitionEventArgs

Класс для аргументов событий распознавания речи.

Конструктор для внутреннего использования.

SpeechRecognitionResult

Базовый класс для результатов распознавания речи.

Конструктор для внутреннего использования.

SpeechRecognizer

Распознаватель речи. Если вам нужно указать сведения об исходном языке, укажите только один из этих трех параметров: язык, source_language_config или auto_detect_source_language_config.

SpeechSynthesisBookmarkEventArgs

Класс для аргументов события закладки синтеза речи.

Примечание

Добавлено в версии 1.16.0.

Конструктор для внутреннего использования.

SpeechSynthesisCancellationDetails

Содержит подробные сведения о том, почему результат был отменен.

SpeechSynthesisEventArgs

Класс для аргументов события синтеза речи.

Конструктор для внутреннего использования.

SpeechSynthesisResult

Результат операции синтеза речи.

Конструктор для внутреннего использования.

SpeechSynthesisVisemeEventArgs

Класс для аргументов события виземы синтеза речи.

Примечание

Добавлено в версии 1.16.0.

Конструктор для внутреннего использования.

SpeechSynthesisWordBoundaryEventArgs

Класс для аргументов события границы слова синтеза речи.

Примечание

Обновлено в версии 1.21.0.

Конструктор для внутреннего использования.

SpeechSynthesizer

Синтезатор речи.

SyllableLevelTimingResult

Содержит результат времени на уровне слога

Примечание

Добавлено в версии 1.20.0.

SynthesisVoicesResult

Содержит подробные сведения о полученном списке голосов синтеза.

Примечание

Добавлено в версии 1.16.0.

Конструктор для внутреннего использования.

VoiceInfo

Содержит подробные сведения о синтезе голосовых данных.

Примечание

Обновлено в версии 1.17.0.

Конструктор для внутреннего использования.

Перечисления

AudioStreamContainerFormat

Определяет поддерживаемый формат контейнера аудиопотока.

AudioStreamWaveFormat

Представляет формат, указанный в контейнере WAV.

CancellationErrorCode

Определяет код ошибки в случае, если CancellationReason имеет значение Error.

CancellationReason

Определяет возможные причины отмены результата распознавания.

NoMatchReason

Определяет возможные причины, по которым не распознается результат распознавания.

OutputFormat

Формат вывода.

ProfanityOption

Удаляет ненормативную лексику (ругательства) или заменяет буквы ненормативной лексики звездами.

PronunciationAssessmentGradingSystem

Определяет систему точек для калибровки показателей произношения; значение по умолчанию — FivePoint.

PronunciationAssessmentGranularity

Определяет степень детализации оценки произношения; Значение по умолчанию — Phoneme.

PropertyId

Определяет идентификаторы свойств речи.

ResultReason

Указывает возможные причины, по которым может быть создан результат распознавания.

ServicePropertyChannel

Определяет каналы, используемые для передачи параметров свойств в службу.

SpeechSynthesisOutputFormat

Определяет возможные форматы выходных аудиофайлов синтеза речи.

StreamStatus

Определяет возможное состояние потока аудиоданных.

SynthesisVoiceGender

Определяет пол голосов синтеза

SynthesisVoiceType

Определяет тип голосов синтеза