Квоты и ограничения службы

Статья
07/10/2024

Это содержимое относится к: версии 4.0 (предварительная версия) | Предыдущие версии: v3.1 (GA) версии 3.0 (GA)

Это содержимое относится к: версия 2.1 Последняя версия: версия 4.0 (предварительная версия) |

В этой статье содержится краткий справочник и подробное описание квот и ограничений службы аналитики документов Azure для всех ценовых категорий. Она также содержит некоторые рекомендации по предотвращению регулирования количества запросов.

Использование модели

Поддерживаемые типы документов	Читать	Макет	Предварительно созданные модели	Пользовательские модели	Возможности надстройки
PDF	✔️	✔️	✔️	✔️	✔️
Изображения: `JPEG/JPG`, , `BMPPNG`, `TIFFHEIF`	✔️	✔️	✔️	✔️	✔️
Microsoft Office: `DOCX`, `PPTXXLS`	✔️	✔️	✖️	✖️	✖️

✔️ = поддерживается = не поддерживается ✖️

Поддерживаемые типы документов	Читать	Макет	Предварительно созданные модели	Пользовательские модели
PDF	✔️	✔️	✔️	✔️
Изображения: `JPEG/JPG`, , `BMPPNG`, `TIFFHEIF`	✔️	✔️	✔️	✔️
Microsoft Office: `DOCX`, `PPTXXLS`	✔️	✖️	✖️	✖️

✔️ = поддерживается = не поддерживается ✖️

Выставление счетов

Выставление счетов аналитики документов вычисляется ежемесячно на основе типа модели и количества проанализированных страниц. Метрики использования можно найти на панели мониторинга метрик в портал Azure. На панели мониторинга отображается количество страниц, которые обрабатываются в azure AI Document Intelligence. Вы можете проверить предполагаемые затраты, потраченные на ресурс, с помощью калькулятора цен Azure. Подробные инструкции см. в разделе "Проверка использования и оценка затрат". Ниже приведены некоторые сведения:

При отправке документа для анализа служба анализирует все страницы, если только не указать диапазон страниц с помощью параметра в запросе pages . Когда служба анализирует документы Microsoft Excel и PowerPoint с помощью модели чтения, OCR или макета, она подсчитывает каждый лист Excel и слайд PowerPoint как одну страницу.
При анализе PDF-файлов и TIFF служба подсчитывает каждую страницу в PDF-файле или каждый образ в TIFF-файле как одну страницу без максимальных ограничений символов.
При анализе microsoft Word и HTML-файлов, которые поддерживают модели чтения и макета, он подсчитывает страницы в блоках из 3000 символов. Например, если в документе содержится 7 000 символов, две страницы с 3000 символами на каждой и одной странице с 1000 символами добавляются в общей сложности три страницы.
Модели чтения и макета не поддерживают анализ внедренных или связанных изображений в Microsoft Word, Excel, PowerPoint и HTML-файлах. Поэтому служба не подсчитывает их как добавленные изображения.
Обучение пользовательской модели всегда бесплатно с помощью аналитики документов. Плата взимается только в том случае, если служба использует модель для анализа документа.
Цены на контейнеры аналогичны ценам на облачную службу.
Аналитика документов предлагает бесплатный уровень (F0), где можно протестировать все функции аналитики документов.
Аналитика документов имеет модель ценообразования на основе обязательств для больших рабочих нагрузок.
Модель макета необходима для создания меток для набора данных для пользовательского обучения. Если набор данных, используемый для пользовательского обучения, не имеет доступных файлов меток, служба создает их для вас и выставляет счета за использование модели макета.

Квота	Бесплатный (F0) ¹	Standard (S0)
Ограничение транзакций в секунду	1	15 (значение по умолчанию)
Регулируется	No	Да ²
Максимальный размер документа	4 МБ	500 МБ
Регулируется	No	No
Максимальное количество страниц (анализ)	2	2000
Регулируется	No	No
Максимальный размер файла меток	10 МБ	10 МБ
Регулируется	No	No
Максимальный размер JSON-ответа OCR	500 МБ	500 МБ
Регулируется	No	No
Максимальное число моделей шаблонов	500	5000
Регулируется	No	No
Максимальное число нейронных моделей	100	500
Регулируется	No	No

Использование пользовательской модели

Квота	Бесплатный (F0) ¹	Standard (S0)
Ограничение при объединении моделей	5	200 (значение по умолчанию)
Регулируется	No	No
*Размер набора данных обучения Нейронный**	1 ГБ ³	1 ГБ (значение по умолчанию)
Регулируется	No	No
*Размер набора данных обучения Шаблон**	50 МБ ⁴	50 МБ (значение по умолчанию)
Регулируется	No	No
*Максимальное количество страниц (обучение) Шаблон**	500	500 (значение по умолчанию)
Регулируется	No	No
*Максимальное количество страниц (обучение) Нейронное**	50,000	50 000 (значение по умолчанию)
Регулируется	No	No
Обучение настраиваемой нейронной модели	10 в месяц	20 в месяц
Регулируется	No	Да ³
*Максимальное количество страниц (обучение) Классификатор**	10,000	10 000 (значение по умолчанию)
Регулируется	No	No
*Максимальное число типов документов (классов) Классификатор**	500	500 (значение по умолчанию)
Регулируется	No	No
*Размер набора данных обучения Классификатор**	1 ГБ	1 ГБ (значение по умолчанию)
Регулируется	No	No
*Минимальное количество выборок на класс Классификатор**	5	5 (значение по умолчанию)
Регулируется	No	No

Ограничения пользовательской модели

Квота	Бесплатный (F0) ¹	Standard (S0)
Ограничение при объединении моделей	5	200 (значение по умолчанию)
Регулируется	No	No
Размер набора данных для обучения	50 МБ	50 МБ (значение по умолчанию)
Регулируется	No	No
Максимальное количество страниц (обучение)	500	500 (значение по умолчанию)
Регулируется	No	No

¹ Ценовая категория "Бесплатно" (F0) также отображает ежемесячные пособия на странице цен.
² См. рекомендации и [инструкции по корректировке(#create-and-submit-support-request).
3 Число обучающих моделей нейронных моделей сбрасывается каждый календарный месяц. Откройте запрос на поддержку, чтобы увеличить ежемесячный лимит обучения.

⁴ Это ограничение применяется ко всем документам, найденным в папке обучающего набора данных до любых обновлений, связанных с метками.

Подробное описание, корректировка квоты и рекомендации

Прежде чем запросить увеличение квоты (если есть такая возможность), убедитесь, что без этого не обойтись. Служба аналитики документов использует автомасштабирование для привлечения необходимых вычислительных ресурсов, снижения затрат клиента и отмены неиспользуемых ресурсов on-demand, не сохраняя чрезмерную емкость оборудования.

Если приложение возвращает код ответа 429 (слишком много запросов) и ваша рабочая нагрузка находится в определенных ограничениях: скорее всего, служба масштабируется до вашего спроса, но пока не достигнет требуемого масштаба. Таким образом, служба не сразу же имеет достаточно ресурсов для обслуживания запроса. Такое состояние обычно является временным и не должно длиться долго.

Общие рекомендации по предотвращению регулирования количества запросов во время автомасштабирования

Чтобы свести к минимуму количество проблем, связанных с регулированием количества запросов (код отклика 429), рекомендуется использовать следующие методы.

Реализация логики повторных попыток в приложении
Избегайте внесения резких изменений в рабочую нагрузку. Постепенное увеличение рабочей нагрузки
Пример. Приложение использует аналитику документов, а текущая рабочая нагрузка составляет 10 TPS (транзакции в секунду). В следующую секунду вы увеличиваете нагрузку до 40 TPS (в четыре раза больше). Служба немедленно начинает масштабирование до выполнения новой нагрузки, но, скорее всего, она не может сделать это в течение секунды, поэтому некоторые запросы получают код ответа 429.

В следующих разделах описаны конкретные случаи настройки квот. Переход к аналитике документов: увеличение количества одновременных запросов

Увеличение лимита запросов на число транзакций в секунду

По умолчанию количество транзакций в секунду ограничено 15 транзакций в секунду для ресурса аналитики документов. Для ценовой категории "Стандартный" это количество можно увеличить. Перед отправкой запроса убедитесь в том, что вам знакомы материалы в этом разделе, а также эти рекомендации.

Увеличение максимального количества одновременных запросов напрямую не влияет на затраты. Служба аналитики документов использует модель "Платить только за то, что вы используете". Ограничение определяет, как высоко служба может масштабироваться перед началом регулирования запросов.

Имеющееся значение параметра "Ограничение одновременных запросов" не отображается через портал Azure, программу командной строки и запросы API. Чтобы проверить имеющееся значение, создайте запрос на поддержку Azure.

Если вы хотите увеличить транзакции в секунду, вы можете включить автоматическое масштабирование ресурса. Следуйте этому документу, чтобы включить автоматическое масштабирование ресурса * включить автоматическое масштабирование. Вы также можете отправить запрос на поддержку TPS.

Подготовьте необходимые сведения

Идентификатор ресурса аналитики документов
Область/регион
Сведения о базовой модели:
- Войдите на портал Azure
- Выберите ресурс аналитики документов, для которого требуется увеличить ограничение транзакций
- Выберите -Properties- (-Resource Management- group)
- Скопируйте и сохраните значения следующих полей:
  - ИД ресурса
  - Расположение (регион конечной точки)

Создание и отправка запроса на поддержку

Чтобы увеличить ограничение на количество транзакций в секунду для ресурса, отправьте запрос в службу поддержки:

Убедитесь, что у вас имеется необходимая информация.
Войдите на портал Azure
Выберите ресурс аналитики документов, для которого требуется увеличить ограничение TPS
Выберите "Новый запрос на поддержку" (-Support + troubleshooting-group). Появится новое окно с автоматически заполненными сведениями о подписке Azure и ресурсе Azure
Введите -Summary- (например, "Увеличить ограничение TPS для аналитики документов")
Выберите "Квота или проверка использования" для поля типа проблемы.
Нажмите кнопку -Далее: решения
Продолжайте создание запроса.
В поле "Описание" введите следующие сведения на вкладке "Сведения".
- Обратите внимание, что запрос относится к квоте аналитики документов.
- Укажите ожидаемое количество транзакций в секунду, до которого необходимо выполнить масштабирование в соответствии с вашими потребностями.
- Сведения о ресурсах Azure, собранные ранее.
- Завершите ввод необходимых сведений и нажмите кнопку "Создать" в -Review + create- tab
- Запишите номер запроса на поддержку в уведомлениях на портале Azure. Обратитесь в службу поддержки, чтобы обратиться к вам в ближайшее время для дальнейшей обработки.

Пример рекомендованного шаблона рабочей нагрузки

В этом примере представлен подход, который мы рекомендуем использовать для предотвращения возможного регулирования количества запросов в связи с выполнением автомасштабирования. Это не точный рецепт, но просто шаблон, который мы приглашаем следовать и настраивать по мере необходимости.

Предположим, что ресурс аналитики документов имеет набор ограничений по умолчанию. Запустите рабочую нагрузку для отправки запросов на анализ. Если вы наблюдаете частое срабатывание функции регулирования с кодом отклика 429, начните с реализации экспоненциальной задержки для запроса на получение ответа для анализа, используя увеличивающиеся интервалы между повторными попытками для последующих сообщений об ошибках (например, по схеме 2-5-13-34 для задержек между запросами). Как правило, мы не рекомендуем вызывать ответ на получение анализа более одного раза каждые 2 секунды для соответствующего запроса POST.

Если вы обнаружите, что количество запросов POST для отправляемых документов начинает регулироваться, попробуйте добавить задержку между запросами. Если для рабочей нагрузки требуется более высокая степень параллельной обработки, необходимо создать запрос на поддержку, чтобы увеличить ограничения службы на транзакции в секунду.

Как правило, мы рекомендуем протестировать рабочую нагрузку и шаблоны рабочей нагрузки перед переходом в рабочую среду.

Следующие шаги

Подробнее о кодах ошибок и устранении неполадок

Поделиться через