Преобразование речи в текстовый REST API

2025-05-25

Преобразование речи в текст REST API используется для пакетного транскрибирования и пользовательской речи.

Внимание

Версия REST API 2024-11-15 преобразования речи в текст — это последняя версия, общедоступная.

преобразования речи в текст будет прекращена в датах, которые будут объявлены.
Распознавание речи в REST API v3.0, v3.1, v3.2, 3.2-preview.1 и 3.2-preview.2 будет прекращено 31 марта 2026 года.

Дополнительные сведения об обновлении см. в руководствах по миграции службы "Речь на текст" REST API версии 3.0 до версии 3.1, версии 3.1 до версии 3.2 и версии 3.2 до 2024-11-15.

Справочная документация по REST API преобразования речи в текст 2024-11-15

Используйте rest API преобразования речи в текст:

Быстрое транскрибирование: транскрибирование аудиофайлов с возвратом результатов синхронно и гораздо быстрее, чем звук в режиме реального времени. Используйте API быстрого транскрибирования (/speechtotext/транскрибирование:transcribe) в сценариях, необходимых для расшифровки аудиозаписи, как можно быстрее с прогнозируемой задержкой, например быстрый аудио- или видеотрансляции или видеотрансляции.
Пакетное транскрибирование: транскрибирование аудиофайлов в виде пакета из нескольких URL-адресов или контейнера Azure. Используйте API пакетного транскрибирования (/speechtotext/транскрибирование:submit) в сценариях, когда необходимо транскрибировать большое количество аудио из хранилища, например, большое количество файлов или один длинный звуковой файл.
Настраиваемая речь: отправка собственных данных, тестирование и обучение пользовательской модели, сравнение точности между моделями и развертывание модели в пользовательской конечной точке. Копирование моделей в другие подписки в случае, если необходимо предоставить коллегам доступ к созданной вами модели, или когда требуется развернуть модель в нескольких регионах.

Rest API преобразования речи в текст включает такие функции, как:

Запрос журналов для каждой конечной точки.
Запрос манифеста создаваемых моделей для настройки локальных контейнеров.
Отправка данных из учетных записей хранения Azure с помощью URI подписанного URL-адреса (SAS).
Принесите собственное хранилище. Используйте собственные учетные записи хранения для журналов, файлов транскрибирования и других данных.
Некоторые операции поддерживают уведомления веб-перехватчика. Вы можете зарегистрировать веб-перехватчики, где отправляются уведомления.

Быстрое транскрибирование

Следующие группы операций применимы для быстрого транскрибирования.

Группа операций	Описание
Транскрипции	Используйте Транскрипции - Транскрибировать для транскрибирования аудиофайлов. При использовании быстрого транскрибирования вы отправляете один файл на запрос. Примеры создания транскрибирования из одного звукового файла см. в статье "Создание транскрибирования ".

Группа операций

Описание

Транскрипции

Используйте Транскрипции - Транскрибировать для транскрибирования аудиофайлов.

При использовании быстрого транскрибирования вы отправляете один файл на запрос. Примеры создания транскрибирования из одного звукового файла см. в статье "Создание транскрибирования ".

Пакетное транскрибирование

Для пакетного транскрибирования применимы следующие группы операций.

Группа операций	Описание
Модели	Используйте базовые модели или пользовательские модели для транскрибирования звуковых файлов. Модели можно использовать с пользовательскими речевыми и пакетными транскрибированием. Например, можно использовать модель, обученную с определенным набором данных для транскрибирования звуковых файлов. Примеры обучения и управления пользовательскими моделями речи см. в статье "Обучение модели" и "Жизненный цикл пользовательской модели речи".
Транскрипции	Используйте Транскрипции - Отправить для транскрибирования большого количества хранимого аудио. При использовании пакетной транскрибирования вы отправляете несколько файлов на запрос или указываете на контейнер Хранилище BLOB-объектов Azure с звуковыми файлами для транскрибирования. Примеры создания транскрибирования из нескольких звуковых файлов см. в статье "Создание транскрибирования ".
Веб-перехватчики	Используйте веб-перехватчики для получения уведомлений о создании, обработке, завершении и удалении событий. Вы можете использовать веб-перехватчики с пользовательской речью и пакетной транскрибированием. Веб-перехватчики применяются к наборам данных, конечным точкам, оценкам, моделям и транскрибированию.

Настраиваемая речь

Для пользовательской речи применимы следующие группы операций.

Группа операций	Описание
Наборы данных	Используйте наборы данных для обучения и тестирования пользовательских моделей речи. Например, можно сравнить производительность пользовательской речи, обученной с определенным набором данных, с производительностью базовой модели или пользовательской модели речи , обученной с другим набором данных. Примеры отправки наборов данных см. в статье "Отправка обучающих и тестовых наборов данных".
Конечные точки	Развертывание пользовательских моделей речи в конечных точках. Для использования пользовательской модели речи необходимо развернуть пользовательскую конечную точку. Примеры управления конечными точками развертывания см. в статье "Развертывание модели ".
Оценки	Используйте оценки для сравнения производительности различных моделей. Например, можно сравнить производительность пользовательской модели речи , обученную с определенным набором данных, с производительностью базовой модели или пользовательской модели, обученной с другим набором данных. Примеры тестирования и оценки пользовательских моделей распознавания речи см. в примерах точности и точности тестирования .
Модели	Используйте базовые модели или пользовательские модели для транскрибирования звуковых файлов. Модели можно использовать с пользовательскими речевыми и пакетными транскрибированием. Например, можно использовать модель, обученную с определенным набором данных для транскрибирования звуковых файлов. Примеры обучения и управления пользовательскими моделями речи см. в статье "Обучение модели" и "Жизненный цикл пользовательской модели речи".
Веб-перехватчики	Используйте веб-перехватчики для получения уведомлений о создании, обработке, завершении и удалении событий. Вы можете использовать веб-перехватчики с пользовательской речью и пакетной транскрибированием. Веб-перехватчики применяются к наборам данных, конечным точкам, оценкам, моделям и транскрибированию.

Поделиться через

Преобразование речи в текстовый REST API

Быстрое транскрибирование

Пакетное транскрибирование

Настраиваемая речь

Связанный контент

Обратная связь

Дополнительные ресурсы