Бөлісу құралы:


Использование собственного ресурса службы "Речь" хранилища (BYOS) для преобразования речи в текст

Перенос собственного хранилища (BYOS) можно использовать в следующих речевых сценариях:

  • Пакетное транскрибирование
  • Транскрибирование в режиме реального времени с включенным ведением журнала результатов аудио и транскрибирования
  • Настраиваемая речь

Один ресурс службы "Речь" для связывания учетных записей хранения можно использовать для всех сценариев одновременно.

В этой статье подробно объясняется, как использовать ресурс службы "Речь с поддержкой BYOS" во всех сценариях преобразования речи в текст. В статье предполагается, что у вас есть полностью настроенный ресурс службы "Речь с поддержкой BYOS" и связанная служба хранилища учетная запись.

Хранилище данных

При использовании BYOS служба "Речь" не сохраняет артефакты клиента после завершения обработки данных (транскрибирования, обучения моделей, тестирования моделей). Однако некоторые метаданные, не производные от содержимого пользователя, хранятся в локальной службе "Речь". Например, в пользовательском сценарии распознавания речи служба сохраняет определенные сведения о пользовательских конечных точках, таких как модели, которые они используют.

Связанная с BYOS учетная запись служба хранилища хранит следующие данные:

Примечание.

Необязательный в этом разделе означает, что это возможно, но не требуется хранить определенные артефакты в учетной записи, связанной с BYOS, служба хранилища. При необходимости их можно хранить в другом месте.

Пакетное транскрибирование

  • Исходный звук (необязательно)
  • Результаты пакетного транскрибирования

Транскрибирование в режиме реального времени с включенным ведением журнала результатов аудио и транскрибирования

  • Журналы результатов аудио и транскрибирования

Настраиваемая речь

  • Исходные файлы наборов данных для обучения и тестирования модели (необязательно)
  • Все данные и метаданные, связанные с пользовательскими моделями, размещенными ресурсом службы "Речь с поддержкой BYOS" (включая копии наборов данных для обучения и тестирования моделей)

Пакетное транскрибирование

Пакетное транскрибирование используется для транскрибирования большого объема звуковых данных в хранилище. Если вы не знакомы с транскрибированием пакетной службы, сначала ознакомьтесь с этой статьей .

Выполните следующие действия, чтобы выполнить пакетную транскрибирование с ресурсом службы "Речь с поддержкой BYOS":

  1. Запустите транскрибирование пакетной службы, как описано в этом руководстве.

    Внимание

    Не используйте destinationContainerUrl параметр в запросе транскрибирования. При использовании BYOS результаты транскрибирования хранятся в учетной записи, связанной с BYOS, служба хранилища учетной записи автоматически.

    Если вы используете destinationContainerUrl параметр, он будет работать, но обеспечивает значительно меньше безопасности для ваших данных из-за нерегламентированного использования SAS. Дополнительные сведения см. здесь.

  2. После завершения транскрибирования получите результаты транскрибирования в соответствии с этим руководством. Рассмотрите возможность использования sasValidityInSeconds параметра (см. следующий раздел).

Служба "Речь" использует customspeech-artifacts контейнер BLOB-объектов в связанной с BYOS служба хранилища учетной записи для хранения промежуточных и окончательных результатов транскрибирования.

Внимание

Служба "Речь" использует предварительно определенные пути к контейнеру BLOB-объектов и имена файлов для модуля транскрибирования пакетной службы для правильной работы. Не перемещайте, не переименуйте или не изменяйте содержимое customspeech-artifacts контейнера.

Сбой этого, скорее всего, приведет к сложной отладке ошибок службы 4xx и 5xx.

Используйте стандартные средства для взаимодействия с транскрибированием пакетной службы. Дополнительные сведения см. в разделе "Транскрибирование пакетной службы".

Получение результатов транскрибирования пакетной службы с помощью REST API

Речь в текстовом REST API полностью поддерживает ресурсы службы "Речь" с поддержкой BYOS. Однако, поскольку данные теперь хранятся в учетной записи служба хранилища с поддержкой BYOS, запросы, такие как Получение файлов транскрибирования, взаимодействуют с связанными с BYOS служба хранилища хранилищем BLOB-объектов, а не внутренними ресурсами службы "Речь". Он позволяет использовать один и тот же код на основе REST API как для обычных, так и для ресурсов службы "Речь с поддержкой BYOS".

Для обеспечения максимальной sasValidityInSeconds безопасности используется параметр со значением, заданным 0 в запросах, которые возвращают URL-адреса файлов данных, такие как запрос "Получить файлы транскрибирования ". Ниже приведен пример URL-адреса запроса:

https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/transcriptions/3b24ca19-2eb1-4a2a-b964-35d89eca486b/files?sasValidityInSeconds=0

Такой запрос возвращает прямые служба хранилища URL-адреса учетной записи к файлам данных (без SAS или других добавлений). Например:

"links": {
        "contentUrl": "https://<BYOS_storage_account_name>.blob.core.windows.net/customspeech-artifacts/TranscriptionData/3b24ca19-2eb1-4a2a-b964-35d89eca486b_0_0.json"
      }

URL-адрес этого формата гарантирует, что только удостоверения Microsoft Entra (пользователи, субъекты-службы, управляемые удостоверения) с достаточными правами доступа (например, роль чтения данных BLOB-объектов служба хранилища) могут получить доступ к данным из URL-адреса.

Предупреждение

Если sasValidityInSeconds параметр опущен в запросе "Файлы транскрибирования " или аналогичных, то для каждого ВОЗВРАЩАемого URL-адреса файла данных будет создан SAS делегирования пользователей с сроком действия 5 дней. Этот SAS подписан управляемым удостоверением управляемого удостоверения, назначаемого системой ресурса службы "Речь с поддержкой BYOS". Из-за этого SAS разрешает доступ к данным, даже если доступ к ключу учетной записи хранения отключен. Дополнительные сведения см. здесь.

Транскрибирование в режиме реального времени с включенным ведением журнала результатов аудио и транскрибирования

Вы можете включить ведение журнала для ввода звука и распознанной речи при использовании речи для перевода текста или речи. Полный описание см. в этой статье.

Если вы используете BYOS, вы найдете журналы в контейнере BLOB-объектов в customspeech-audiologs учетной записи, связанной с BYOS, служба хранилища учетной записи.

Предупреждение

Данные журнала хранятся в течение 5 дней. После этого периода журналы автоматически удаляются. Это допустимо для ресурсов службы "Речь с поддержкой BYOS". Если вы хотите сохранить журналы дольше, скопируйте соответствующие файлы и папки из customspeech-audiologs контейнера BLOB-объектов напрямую или используйте REST API.

Получение журналов транскрибирования в режиме реального времени с помощью REST API

Речь в текстовом REST API полностью поддерживает ресурсы службы "Речь" с поддержкой BYOS. Однако, так как данные теперь хранятся в учетной записи служба хранилища с поддержкой BYOS, запросы, такие как получение журналов базовой модели, взаимодействуют с хранилищем BLOB-объектов, служба хранилища связанным с BYOS, а не внутренними ресурсами службы "Речь". Он позволяет использовать один и тот же код на основе REST API как для обычных, так и для ресурсов службы "Речь с поддержкой BYOS".

Для обеспечения максимальной sasValidityInSeconds безопасности используется параметр со значением, заданным 0 в запросах, которые возвращают URL-адреса файлов данных, такие как запрос "Получить журналы базовой модели". Ниже приведен пример URL-адреса запроса:

https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/endpoints/base/en-US/files/logs?sasValidityInSeconds=0

Такой запрос возвращает прямые служба хранилища URL-адреса учетной записи к файлам данных (без SAS или других добавлений). Например:

"links": {
        "contentUrl": "https://<BYOS_storage_account_name>.blob.core.windows.net/customspeech-audiologs/be172190e1334399852185c0addee9d6/en-US/2023-07-06/152339_fcf52189-0d3f-4415-becd-5f639fd7fd6b.v2.json"
      }

URL-адрес этого формата гарантирует, что только удостоверения Microsoft Entra (пользователи, субъекты-службы, управляемые удостоверения) с достаточными правами доступа (например, роль чтения данных BLOB-объектов служба хранилища) могут получить доступ к данным из URL-адреса.

Предупреждение

Если sasValidityInSeconds параметр опущен в запросе на получение журналов базовой модели или аналогичных , то возвращается SAS делегирования пользователей с сроком действия 5 дней для каждого URL-адреса файла данных. Этот SAS подписан управляемым удостоверением управляемого удостоверения, назначаемого системой ресурса службы "Речь с поддержкой BYOS". Из-за этого SAS разрешает доступ к данным, даже если доступ к ключу учетной записи хранения отключен. Дополнительные сведения см. здесь.

Настраиваемая речь

С помощью пользовательской речи можно оценить и повысить точность распознавания речи для приложений и продуктов. Пользовательская модель речи может использоваться для преобразования речи в режиме реального времени в текст, перевод речи и пакетное транскрибирование. Дополнительные сведения см. в обзоре пользовательской речи.

Нет ничего конкретного о том, как вы используете пользовательскую речь с ресурсом службы "Речь с поддержкой BYOS". Единственное различие заключается в том, что хранятся все связанные с пользовательской моделью данные, которые служба "Речь" собирает и создает для вас. Данные хранятся в следующих контейнерах BLOB-объектов, связанных с BYOS, служба хранилища учетной записи:

  • customspeech-models — расположение пользовательских моделей речи
  • customspeech-artifacts — расположение всех других пользовательских данных, связанных с речью

Структура контейнера BLOB-объектов предоставляется только для ваших сведений и подлежит изменению без уведомления.

Внимание

Служба "Речь" использует предварительно определенные пути к контейнеру BLOB-объектов и имена файлов для правильной работы пользовательского модуля речи. Не перемещайте, не переименуйте или не изменяйте содержимое контейнера и пользовательских customspeech-models папок customspeech-artifacts , связанных с речью контейнера.

Сбой, скорее всего, приведет к сложной отладке ошибок и может привести к необходимости переобучения пользовательской модели.

Используйте стандартные средства, такие как REST API и Speech Studio, для взаимодействия с пользовательскими данными, связанными с речью. Дополнительные сведения см. в разделе пользовательской речи.

Использование REST API с пользовательской речью

Речь в текстовом REST API полностью поддерживает ресурсы службы "Речь" с поддержкой BYOS. Однако поскольку данные теперь хранятся в учетной записи служба хранилища с поддержкой BYOS, запросы, такие как Datasets_ListFiles взаимодействуют с хранилищем BLOB-объектов, служба хранилища связанным с BYOS, а не с внутренними ресурсами службы "Речь". Он позволяет использовать один и тот же код на основе REST API как для обычных, так и для ресурсов службы "Речь с поддержкой BYOS".

Для обеспечения максимальной sasValidityInSeconds безопасности используется параметр со значением, заданным 0 в запросах, которые возвращают URL-адреса файлов данных, например запрос на получение файлов набора данных. Ниже приведен пример URL-адреса запроса:

https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/datasets/8427b92a-cb50-4cda-bf04-964ea1b1781b/files?sasValidityInSeconds=0

Такой запрос возвращает прямые служба хранилища URL-адреса учетной записи к файлам данных (без SAS или других добавлений). Например:

 "links": {
        "contentUrl": "https://<BYOS_storage_account_name>.blob.core.windows.net/customspeech-artifacts/AcousticData/8427b92a-cb50-4cda-bf04-964ea1b1781b/4a61ddac-5b1c-4c21-b87d-22001b0f18ab.zip"
      }

URL-адрес этого формата гарантирует, что только удостоверения Microsoft Entra (пользователи, субъекты-службы, управляемые удостоверения) с достаточными правами доступа (например, роль чтения данных BLOB-объектов служба хранилища) могут получить доступ к данным из URL-адреса.

Предупреждение

Если sasValidityInSeconds параметр опущен в запросе на получение файлов набора данных или аналогичных, то sas делегирования пользователей с сроком действия 5 дней будет создан для каждого URL-адреса файла данных, возвращенного. Этот SAS подписан управляемым удостоверением управляемого удостоверения, назначаемого системой ресурса службы "Речь с поддержкой BYOS". Из-за этого SAS разрешает доступ к данным, даже если доступ к ключу учетной записи хранения отключен. Дополнительные сведения см. здесь.

Следующие шаги