Преобразование речи в текстовый REST API
Преобразование речи в текст REST API используется для пакетного транскрибирования и пользовательской речи.
Внимание
Речь в REST API версии 3.2 — это последняя версия, общедоступная. Предварительные версии 3.2-preview.1 и 3.2-preview.2* будут удалены в сентябре 2024 г. Речь в тексте REST API версии 3.1 будет прекращена на дату объявления. Дополнительные сведения об обновлении см. в руководстве по миграции REST API службы "Речь" версии 3.1 до версии 3.2 . Речь в REST API версии 3.0 будет прекращена 1 апреля 2026 г. Дополнительные сведения об обновлении см. в руководствах по миграции службы "Речь" на текст REST API версии 3.0 до версии 3.1 и версии 3.1 до версии 3.2 .
Используйте rest API преобразования речи в текст:
- Быстрое транскрибирование: транскрибирование аудиофайлов с возвратом результатов синхронно и гораздо быстрее, чем звук в режиме реального времени. Используйте API быстрого транскрибирования (/speechtotext/транскрибирование:transcribe) в сценариях, необходимых для расшифровки аудиозаписи, как можно быстрее с прогнозируемой задержкой, например быстрый аудио- или видеотрансляции или видеотрансляции.
- Настраиваемая речь: отправка собственных данных, тестирование и обучение пользовательской модели, сравнение точности между моделями и развертывание модели в пользовательской конечной точке. Копирование моделей в другие подписки в случае, если необходимо предоставить коллегам доступ к созданной вами модели, или когда требуется развернуть модель в нескольких регионах.
- Пакетное транскрибирование: транскрибирование аудиофайлов в виде пакета из нескольких URL-адресов или контейнера Azure.
Rest API преобразования речи в текст включает такие функции, как:
- Получите журналы для каждой конечной точки, если для этой конечной точки запрашиваются журналы.
- Запрос манифеста создаваемых моделей для настройки локальных контейнеров.
- Отправка данных из учетных записей хранения Azure с помощью URI подписанного URL-адреса (SAS).
- Принесите собственное хранилище. Используйте собственные учетные записи хранения для журналов, файлов транскрибирования и других данных.
- Некоторые операции поддерживают уведомления веб-перехватчика. Вы можете зарегистрировать веб-перехватчики, где отправляются уведомления.
Пакетное транскрибирование
Для пакетного транскрибирования применимы следующие группы операций.
Группа операций | Description |
---|---|
Модели | Используйте базовые модели или пользовательские модели для транскрибирования звуковых файлов. Модели можно использовать с пользовательскими речевыми и пакетными транскрибированием. Например, можно использовать модель, обученную с определенным набором данных для транскрибирования звуковых файлов. Примеры обучения и управления пользовательскими моделями речи см. в статье "Обучение модели" и "Жизненный цикл пользовательской модели речи". |
Транскрипции | Используйте транскрибирование для транскрибирования большого объема звука в хранилище. При использовании пакетной транскрибирования вы отправляете несколько файлов на запрос или указываете на контейнер Хранилище BLOB-объектов Azure с звуковыми файлами для транскрибирования. Примеры создания транскрибирования из нескольких звуковых файлов см. в статье "Создание транскрибирования ". |
Веб-перехватчики | Используйте веб-перехватчики для получения уведомлений о создании, обработке, завершении и удалении событий. Вы можете использовать веб-перехватчики с пользовательской речью и пакетной транскрибированием. Веб-перехватчики применяются к наборам данных, конечным точкам, оценкам, моделям и транскрибированию. |
Настраиваемая речь
Для пользовательской речи применимы следующие группы операций.
Группа операций | Description |
---|---|
Наборы данных | Используйте наборы данных для обучения и тестирования пользовательских моделей речи. Например, можно сравнить производительность пользовательской речи, обученной с определенным набором данных, с производительностью базовой модели или пользовательской модели речи , обученной с другим набором данных. Примеры отправки наборов данных см. в статье "Отправка обучающих и тестовых наборов данных". |
Конечные точки | Развертывание пользовательских моделей речи в конечных точках. Для использования пользовательской модели речи необходимо развернуть пользовательскую конечную точку. Примеры управления конечными точками развертывания см. в статье "Развертывание модели ". |
Оценки | Используйте оценки для сравнения производительности различных моделей. Например, можно сравнить производительность пользовательской модели речи , обученную с определенным набором данных, с производительностью базовой модели или пользовательской модели, обученной с другим набором данных. Примеры тестирования и оценки пользовательских моделей распознавания речи см. в примерах точности и точности тестирования. |
Модели | Используйте базовые модели или пользовательские модели для транскрибирования звуковых файлов. Модели можно использовать с пользовательскими речевыми и пакетными транскрибированием. Например, можно использовать модель, обученную с определенным набором данных для транскрибирования звуковых файлов. Примеры обучения и управления пользовательскими моделями речи см. в статье "Обучение модели" и "Жизненный цикл пользовательской модели речи". |
Проекты | Используйте проекты для управления пользовательскими моделями речи, обучением и тестированием наборов данных и конечными точками развертывания. Пользовательские проекты речи содержат модели, обучающие и тестовые наборы данных, а также конечные точки развертывания. Каждый проект имеет определенный языковой стандарт. Например, можно создать проект для американского варианта английского языка. Примеры создания проектов см. в статье "Создание проекта ". |
Веб-перехватчики | Используйте веб-перехватчики для получения уведомлений о создании, обработке, завершении и удалении событий. Вы можете использовать веб-перехватчики с пользовательской речью и пакетной транскрибированием. Веб-перехватчики применяются к наборам данных, конечным точкам, оценкам, моделям и транскрибированию. |
Работоспособность службы
Работоспособность служб предоставляет аналитические сведения о общей работоспособности службы и вложенных компонентов. Дополнительные сведения см. в разделе "Работоспособности служб".