Поделиться через


Попробуйте индексатор видео Azure AI, включенный Arc (предварительная версия)

Индексатор видео Azure AI, включенный Arc, — это служба с поддержкой расширения Azure Arc , которая выполняет видео и аудиоанализ, а также генерирует ИИ на пограничных устройствах. Решение предназначено для запуска в Kubernetes с поддержкой Azure Arc и поддерживает множество форматов видео, включая MP4 и другие распространенные форматы. Он поддерживает несколько языков во всех основных моделях, связанных с звуком. Предполагается, что один ресурс Индексатора видео сопоставляется с одним расширением.

В этой статье описаны действия, необходимые для включения индексатора видео в качестве расширения Arc в текущей инфраструктуре.

Необходимые компоненты

Внимание

Чтобы успешно развернуть расширение Индексатора видео Azure, необходимо заранее утвердить идентификатор подписки Azure. Сначала необходимо зарегистрироваться с помощью этой формы.

  • Создайте подписку Azure с разрешениями для создания ресурсов Azure.
  • Создайте учетную запись индексатора видео Azure AI. Используйте руководство по созданию учетной записи индексатора видео.
  • Создайте кластер Kubernetes с поддержкой Arc.
  • Скачайте пример видео.

Чтобы использовать расширение Индексатора видео, необходимо иметь внешнюю конечную точку, которая может быть DNS-именем или IP-адресом. Конечная точка должна быть задана как протокол безопасной передачи (https:\\) и используется в качестве конечной точки API расширения. Он также используется веб-порталом Индексатора видео для взаимодействия с расширением. Рекомендуется использовать элемент управления входящего трафика для управления конечной точкой.

Примечание.

Если конечная точка недоступна в общедоступном режиме, вы сможете выполнять действия по расширению с веб-портала только из локальной сети.

Минимальные требования к оборудованию для этого краткого руководства

Это краткое руководство предназначено для просмотра расширения в действии, поэтому для работы с тестовой средой выбраны меньшие размеры ресурсов. Для этого краткого руководства минимальные требования к оборудованию:

  • ЦП: 16 ядер
  • Память: 16 ГБ.

ЦП в узлах должен поддерживать AVX2. Она поддерживается большинством новых ЦП, но может не поддерживаться в некоторых старых средах виртуализации.

Минимальные требования к оборудованию в рабочей среде см. в статье "Минимальные требования к оборудованию".

Минимальные требования к программному обеспечению

Компонент Минимальные требования
Операционная система Ubuntu 22.04 LTS или любая совместимая с Linux ОС
Kubernetes 1,26
Azure CLI 2.48.0

Определения параметров

Параметр  По умолчанию.  Description
Пространство имен выпуска  yes Пространство имен Kubernetes, в которое устанавливается расширение
cluster-name Имя экземпляра Azure Arc Kubernetes
resource-group Имя группы ресурсов Azure Arc Kubernetes
версия  yes  Версия расширения индексатора видео, оставьте пустой для последней версии
speech.endpointUri Конечная точка URL-адреса службы распознавания речи (ссылка)
speech.secret  Секрет экземпляра речи (ссылка)
translate.endpointUri  Конечная точка URL-адреса службы перевода (ссылка)
translate.secret  Секрет службы перевода (ссылка)
ocr.endpointUri Конечная точка URL-адреса службы OCR (ссылка)
ocr.secret Секрет службы OCR (ссылка)
videoIndexer.accountId Идентификатор учетной записи индексатора видео
videoIndexer.endpointUri  Dns-имя или IP-адрес для использования в качестве внешней конечной точки расширения.

Подготовка к развертыванию

Во время развертывания скрипт запрашивает конкретные значения среды. Готовы ли эти значения, чтобы можно было скопировать и вставить их, когда скрипт запрашивает их.

Вопрос Значение Сведения
Что такое идентификатор учетной записи индексатора видео во время развертывания? GUID Идентификатор учетной записи индексатора видео
Что такое идентификатор подписки Azure во время развертывания? GUID Идентификатор подписки Azure
Что такое имя группы ресурсов Индексатора видео во время развертывания? строка Имя группы ресурсов учетной записи индексатора видео
Что такое имя учетной записи индексатора видео во время развертывания? строка Имя учетной записи индексатора видео

Развертывание с помощью портала Azure

  1. На портале Azure перейдите к кластеру, подключенному к Azure Arc.
  2. В меню выберите Extensions>+ Add>Azure AI Video Indexer Arc Extension.
  3. Нажмите кнопку создания. Откроется экран расширения индексатора видео ИИ.
  4. Настройте расширение в сведениях о экземпляре:
    1. Выберите подписку и группу ресурсов для расширения.
    2. Выберите регион и подключенный кластер k8.
    3. Введите имя расширения.
    4. Выберите учетную запись индексатора видео Azure AI, к которому будет подключено расширение.
    5. Введите конечную точку кластера, IP-адрес или DNS-имя, которое будет использоваться в качестве конечной точки API.
    6. Укажите класс хранилища, который вы хотите использовать для расширения, поддерживаемого дистрибутивом Kubernetes. Например, если вы используете AKS, можно использовать azurefile-cli. Дополнительные сведения о предопределенных классах хранения, поддерживаемых AKS, см. в статье Классы хранения в AKS. Если вы используете другой дистрибутив Kubernetes, список поддерживаемых предопределенных классов хранения или способ предоставления собственного класса см. в документации к своему дистрибутиву.
    7. Выберите созданную модель ИИ, чтобы применить возможности искусственного интеллекта, такие как текстовое сводные данные по VI, включенной Arc. Дополнительные сведения о моделях генерированных ИИ.
  5. Выберите Просмотр и создание, а затем щелкните Создать.

Ручное развертывание

Используйте пример скрипта развертывания, чтобы вручную развернуть расширение. Прежде чем приступить к работе, это некоторые вещи, которые следует учитывать:

  • Класс хранилища — расширение Индексатора видео требует, чтобы том хранилища был доступен в кластере Kubernetes. Класс хранилища должен поддерживаться ReadWriteMany. Важно отметить, что процесс индексирования является интенсивным, поэтому операции ввода-вывода (операции ввода-вывода в секунду) тома хранилища будут существенно влиять на длительность процесса.
  • Управляемые ресурсы ИИ— некоторые ресурсы ИИ Azure (переводчик, транскрибирование и OCR) будут созданы в клиенте Майкрософт. Эти ресурсы предназначены только для вашей подписки и находятся в модели оплаты по мере использования. Если у вас уже есть ресурс Индексатора видео с поддержкой AI Arc, он будет связан с существующими ресурсами ИИ Azure.

Внимание

Если вы используете языковую модель, необходимо пометить узел или пул узлов с помощью "workload:summarization". Метка — это пара "ключ-значение", ключ — "рабочая нагрузка", а значение — "суммирование". Компьютер, помеченный этой меткой, должен иметь не менее 32 ЦП (для рабочей среды), и настоятельно рекомендуем использовать процессоры Intel (в отличие от AMD).

Совет

Следуйте инструкциям из статьи о подключении кластера к Azure Arc в Документации Azure для полного пошагового руководства по этому процессу.

Дополнительные настройки

Параметры расширения по умолчанию задаются для обработки общих рабочих нагрузок для конкретных случаев, для настройки выделения ресурсов можно использовать следующие параметры:

Параметр По умолчанию. Description
AI.nodeSelector - Метка селектора узла, для которой назначены модули Pod ИИ (речь и перевод)
speech.resource.requests.cpu 1 Запрошенный номер ядер для модуля pod службы "Речь"
speech.resource.requests.mem 2Gi Запрошенная емкость памяти для модуля pod службы "Речь"
speech.resource.limits.cpu 2 Ограничение числа ядер для модуля pod речи. должен быть > speech.resource.requests.cpu
speech.resource.limits.mem 3Gi Ограничения емкости памяти для модуля pod службы "Речь". должен быть > speech.resource.requests.mem
translate.resource.requests.cpu 1 Запрошенный номер ядер для модуля pod перевода
translate.resource.requests.mem 16Gi Запрошенная емкость памяти для модуля pod перевода
translate.resource.limits.cpu -- Ограничение числа ядер для модуля pod перевода. должен быть > translate.resource.requests.cpu
translate.resource.limits.mem -- Ограничение емкости памяти для модуля pod перевода. должен быть > translate.resource.requests.mem
videoIndexer.webapi.resources.requests.cpu 0,5 Число ядер для модуля pod веб-API
videoIndexer.webapi.resources.requests.mem 4Gi Емкость памяти запроса для модуля pod веб-API
videoIndexer.webapi.resources.limits.cpu 1 Ограничение числа ядер для модуля pod веб-API
videoIndexer.webapi.resources.limits.mem 6Gi Ограничения емкости памяти для модуля pod веб-API
videoIndexer.webapi.resources.limits.mem 6Gi Ограничения емкости памяти для модуля pod веб-API
storage.storageClass "" Используемый класс хранилища
storage.useExternalPvc false определяет, используется ли внешний ПВХ. Значение true, ВВВ VideoIndexer не установлен

Развертывание с помощью ARM или Bicep

Вы можете развернуть индексатор видео Azure AI, включенный Arc, с помощью шаблона ARM или Bicep. Подробные инструкции см. в репозитории Samples README .