Установка и запуск контейнеров

Поддержка контейнеров в настоящее время доступна в версии 2022-08-31 (GA) Аналитики документов для всех моделей и 2023-07-31 (GA) только для чтения и макета:

✔️ Ознакомьтесь с разделом "Установка и запуск контейнеров Аналитики документов версии 3.0" для поддерживаемой документации по контейнерам.

Это содержимое относится к:checkmarkv3.0 (GA)checkmarkv3.1 (GA)

Аналитика документов Azure — это служба ИИ Azure, которая позволяет создавать автоматизированное программное обеспечение для обработки данных с помощью технологии машинного обучения. Аналитика документов позволяет выявлять и извлекать текст, пары "ключ-значение", метки выделения, табличные данные и многое другое из документов. Результаты предоставляются в виде структурированных данных, которые .. /включает связи в исходном файле.

В этой статье вы узнаете, как скачать, установить и запустить контейнеры аналитики документов. Контейнеры позволяют запускать службу аналитики документов в собственной среде. Контейнеры соответствуют конкретным требованиям к безопасности и управлению данными.

  • Модели чтения и макета поддерживаются контейнерами Аналитики документов версии 3.1.

  • Чтение, макет, общий документ, документ идентификатора, квитанция, счет, визитная карточка и пользовательские модели поддерживаются контейнерами Аналитики документов версии 3.0.

  • Модель визитной карточки в настоящее время поддерживается только в контейнерах версии 2.1.

Необходимые компоненты

Чтобы приступить к работе, требуется активная учетная запись Azure. Если ее нет, можно создать бесплатную учетную запись.

Для использования контейнеров аналитики документов также требуется следующее:

Обязательное поле Характер использования
Знакомство с Docker У вас должны быть базовые знания о концепциях Docker, таких как реестры, репозитории, контейнеры и образы контейнеров, а также знание основной dockerтерминологии и команд.
Модуль Docker установлен
  • На главном компьютере должен быть установлен модуль Docker. Docker предоставляет пакеты, которые настраивают среду Docker в ОС macOS, Windows и Linux. Ознакомьтесь с общими сведениями о Docker и контейнерах.
  • Docker нужно настроить таким образом, чтобы контейнеры могли подключать и отправлять данные о выставлении счетов в Azure.
  • В Windows для поддержки контейнеров Linux также должен быть настроен Docker.
Ресурс аналитики документов Однослужба Azure AI Document Intelligence или ресурс с несколькими службами в портал Azure. Чтобы использовать контейнеры, необходимо иметь соответствующий ключ и универсальный код ресурса (URI) конечной точки. Оба значения доступны на странице портал Azure ключей аналитики документов и конечной точки:
  • {FORM_RECOGNIZER_KEY}: один из двух доступных ключей ресурсов.
  • {FORM_RECOGNIZER_ENDPOINT_URI}: конечная точка для ресурса, используемая для трассировки сведений о выставлении счетов.
Необязательно Характер использования
Azure CLI (интерфейс командной строки) Azure CLI позволяет использовать набор онлайн-команд для создания ресурсов Azure и управления ими. Интерфейс доступен для установки в средах Windows, macOS и Linux и может запускаться в контейнере Docker и в Azure Cloud Shell.

Требования к компьютеру узла

Узел — это 64-разрядный компьютер, на котором выполняется контейнер Docker. Это может быть компьютер в локальной среде или служба размещения Docker в Azure, включая следующие решения:

Требования к контейнеру и рекомендации

Обязательные вспомогательные контейнеры

В следующей таблице перечислены вспомогательные контейнеры для каждого загружаемого контейнера аналитики документов. Дополнительные сведения приведены в разделе Выставление счетов.

Контейнер элементов Контейнеры поддержки
Чтение Необязательное
Макет Необязательное
Визитная карточка Чтение
Общий документ Макет
Счет-фактура Макет
Получения Чтение или макет
Удостоверение Чтение
Пользовательский шаблон Макет

Примечание.

Минимальные и рекомендуемые значения основаны на ограничениях Docker, а не на ресурсах узла.

Контейнеры аналитики документов
Контейнер Минимальная конфигурация Рекомендуемая конфигурация
Read 8 ядра, 10 ГБ памяти 8 ядра, 24 ГБ памяти
Layout 8 ядра, 16 ГБ памяти 8 ядра, 24 ГБ памяти
Business Card 8 ядра, 16 ГБ памяти 8 ядра, 24 ГБ памяти
General Document 8 ядра, 12 ГБ памяти 8 ядра, 24 ГБ памяти
ID Document 8 ядра, 8 ГБ памяти 8 ядра, 24 ГБ памяти
Invoice 8 ядра, 16 ГБ памяти 8 ядра, 24 ГБ памяти
Receipt 8 ядра, 11 ГБ памяти 8 ядра, 24 ГБ памяти
Custom Template 8 ядра, 16 ГБ памяти 8 ядра, 24 ГБ памяти
  • Частота каждого ядра должна быть минимум 2,6 ГГц.
  • Ядро и память соответствуют параметрам --cpus и --memory, которые используются как часть команды docker compose или docker run.

Совет

Используйте команду docker images, чтобы получить список скачанных образов контейнеров. Например, следующая команда возвращает таблицу со списком идентификаторов, репозиториев и тегов для каждого скачанного образа контейнера:

docker images --format "table {{.ID}}\t{{.Repository}}\t{{.Tag}}"

IMAGE ID         REPOSITORY                TAG
<image-id>       <repository-path/name>    <tag-name>

Запустите контейнер с помощью команды docker-compose up.

  • Замените значения {ENDPOINT_URI} и {API_KEY} на URI конечной точки ресурса и ключ со страницы ресурса Azure.

    Screenshot of Azure portal keys and endpoint page.

  • Убедитесь, что значение EULA установлено для принятия.

  • Значение EULA, Billingи ApiKey значения должны быть указаны; в противном случае контейнер не может запуститься.

Важно!

Ключи используются для доступа к ресурсу Аналитики документов. Не предоставляйте доступ к ключам. Храните их защищенным образом, например в Azure Key Vault. Также рекомендуется регулярно обновлять эти ключи. Для вызова API необходим только один ключ. При повторном создании первого ключа можно использовать второй ключ для продолжения доступа к службе.

Следующий пример кода является автономным docker compose примером для запуска контейнера макета аналитики документов. При работе в docker compose используйте файл YAML для настройки служб приложения. Затем с помощью команды вы создадите docker-compose up и запустите все службы из конфигурации. Введите значения {FORM_RECOGNIZER_ENDPOINT_URI} и {FORM_RECOGNIZER_KEY} для экземпляра контейнера Макета.

version: "3.9"
services:
  azure-form-recognizer-read:
    container_name: azure-form-recognizer-read
    image: mcr.microsoft.com/azure-cognitive-services/form-recognizer/read-3.0
    environment:
      - EULA=accept
      - billing={FORM_RECOGNIZER_ENDPOINT_URI}
      - apiKey={FORM_RECOGNIZER_KEY}
    ports:
      - "5000:5000"
    networks:
      - ocrvnet
networks:
  ocrvnet:
    driver: bridge

Теперь можно запустить службу с помощью команды docker compose.

docker-compose up

Убедитесь, что сервер запущен.

Есть несколько способов проверить, что контейнер запущен:

  • Контейнер предоставляет домашнюю страницу \ в качестве визуальной проверки того, что контейнер работает.

  • Вы можете открыть свой любимый веб-браузер и перейти к внешнему IP-адресу и открытому порту соответствующего контейнера. Используйте УКАЗАННЫе URL-адреса запроса для проверки запуска контейнера. Перечисленные примеры URL-адресов запросов являются http://localhost:5000, но конкретный контейнер может отличаться. Помните, что вы переходите к Внешнему IP-адресу и открытому порту контейнера.

    Запросить URL-адрес Характер использования
    http://localhost:5000/ Контейнер предоставляет домашнюю страницу.
    http://localhost:5000/ready Запрос с помощью команды GET это подтверждает, что контейнер готов принять запрос к модели. Этот запрос может использоваться для проб активности и готовности Kubernetes.
    http://localhost:5000/status Запрос с помощью команды GET проверяет, действителен ли ключ API, используемый для запуска контейнера, без запроса конечной точки. Этот запрос может использоваться для проб активности и готовности Kubernetes.
    http://localhost:5000/swagger Контейнер предоставляет полный набор документации по конечным точкам и функции Попробовать. Эта функция позволяет ввести параметры в веб-форму HTML и создать запрос без необходимости писать код. После возврата запроса предоставляется пример команды CURL, чтобы продемонстрировать необходимые заголовки HTTP и формат текста.

Screenshot of Azure containers welcome page.

Остановка контейнеров

Чтобы остановить контейнеры, используйте следующую команду.

docker-compose down

Выставление счетов

Контейнеры аналитики документов отправляют сведения о выставлении счетов в Azure с помощью ресурса Аналитики документов в учетной записи Azure.

Запросы к контейнеру выставляются по ценовой категории ресурса Azure, используемого для API Key. Плата взимается за каждый экземпляр контейнера, используемый для обработки документов и изображений.

Подключение к Azure

Для запуска контейнера необходимо указать значения аргументов, касающихся выставления счетов. Эти значения обеспечивают подключение контейнера к конечной точке выставления счетов. Отчеты об использовании контейнера примерно каждые 10—15 минут. Если контейнер не подключится к Azure в течение допустимого периода времени, контейнер будет продолжать работать, но не будет обслуживать запросы, пока не будет восстановлена конечная точка выставления счетов. Попытки подключения выполняются 10 раз на протяжении одинакового интервала времени (10–15 минут). Если контейнеру не удается подключиться к конечной точке выставления счетов за 10 попыток, он останавливает запросы на обслуживание. См. часто задаваемые вопросы о контейнере ИИ Azure, чтобы получить пример информации, отправляемой в Корпорацию Майкрософт для выставления счетов.

Аргументы для выставления счетов

Команда docker-compose up запускает контейнер, когда все три из следующих параметров предоставляются допустимыми значениями:

Параметр Описание
ApiKey Ключ ресурса служб ИИ Azure, используемого для отслеживания сведений о выставлении счетов.
Значение этого параметра должно быть задано в качестве ключа для подготовленного ресурса, указанного в Billing.
Billing Конечная точка ресурса служб искусственного интеллекта Azure, используемая для отслеживания сведений о выставлении счетов.
Этому параметру следует присвоить URI конечной точки подготовленного ресурса Azure.
Eula Указывает, что вы приняли условия лицензии для контейнера.
Для этого параметра следует задать значение accept.

Дополнительные сведения об этих параметрах см. в статье Настройка контейнеров.

Итоги

Вот и все! В этой статье вы узнали основные понятия и рабочие процессы для скачивания, установки и запуска контейнеров аналитики документов. Сводка:

  • Аналитика документов предоставляет семь контейнеров Linux для Docker.
  • Образы контейнеров загружаются из mcr.
  • Образы контейнеров выполняются в Docker.
  • При создании экземпляра контейнера необходимо указать данные для выставления счетов.

Важно!

Контейнеры ИИ Azure не лицензируются для запуска без подключения к Azure для измерения. Клиенты должны разрешить контейнерам непрерывную передачу данных для выставления счетов в службу контроля потребления. Контейнеры ИИ Azure не отправляют данные клиента (например, изображение или текст, анализируемый) в корпорацию Майкрософт.

Следующие шаги