Квоты и ограничения службы

Это содержимое относится к:v4.0 (предварительная версия) | Предыдущие версии:checkmarkblue-checkmarkv3.1 (GA)blue-checkmarkv3.0 (GA)

Это содержимое относится к:v2.1 Последняя версияblue-checkmark:checkmarkv4.0 (предварительная версия) |

В этой статье содержится краткий справочник и подробное описание квот и ограничений службы аналитики документов Azure для всех ценовых категорий. Она также содержит некоторые рекомендации по предотвращению регулирования количества запросов.

Использование модели

Поддерживаемые типы документов Читать Макет Предварительно созданные модели Пользовательские модели
PDF ✔️ ✔️ ✔️ ✔️
Изображения (JPEG/JPG), PNG, BMP, TIFF, HEIF ✔️ ✔️ ✔️ ✔️
Типы файлов Office DOCX, PPTX, XLS ✔️ ✖️ ✖️ ✖️
Поддерживаемые типы документов Читать Макет Предварительно созданные модели Пользовательские модели
PDF ✔️ ✔️ ✔️ ✔️
Изображения (JPEG/JPG), PNG, BMP, TIFF, HEIF ✔️ ✔️ ✔️ ✔️
Типы файлов Office DOCX, PPTX, XLS ✔️ ✔️ ✖️ ✖️
Квота Бесплатный (F0) 1 Standard (S0)
Ограничение транзакций в секунду 1 15 (значение по умолчанию)
Регулируется No Да 2
Максимальный размер документа 4 МБ 500 МБ
Регулируется No No
Максимальное количество страниц (анализ) 2 2000
Регулируется No No
Максимальный размер файла меток 10 МБ 10 МБ
Регулируется No No
Максимальный размер JSON-ответа OCR 500 МБ 500 МБ
Регулируется No No
Максимальное число моделей шаблонов 500 5000
Регулируется No No
Максимальное число нейронных моделей 100 500
Регулируется No No

Использование пользовательской модели

Квота Бесплатный (F0) 1 Standard (S0)
Ограничение при объединении моделей 5 200 (значение по умолчанию)
Регулируется No No
Размер набора данных обучения * Нейронный 1 ГБ 3 1 ГБ (значение по умолчанию)
Регулируется No No
Размер набора данных обучения * Шаблон 50 МБ 4 50 МБ (значение по умолчанию)
Регулируется No No
Максимальное количество страниц (обучение) * Шаблон 500 500 (значение по умолчанию)
Регулируется No No
Максимальное количество страниц (обучение) * Нейронное 50,000 50 000 (значение по умолчанию)
Регулируется No No
Обучение настраиваемой нейронной модели 10 в месяц 20 в месяц
Регулируется No Да 3
Максимальное количество страниц (обучение) * Классификатор 10,000 10 000 (значение по умолчанию)
Регулируется No No
Максимальное число типов документов (классов) * Классификатор 500 500 (значение по умолчанию)
Регулируется No No
Размер набора данных обучения * Классификатор 1 ГБ 1 ГБ (значение по умолчанию)
Регулируется No No
Минимальное количество выборок на класс * Классификатор 5 5 (значение по умолчанию)
Регулируется No No

Ограничения пользовательской модели

Квота Бесплатный (F0) 1 Standard (S0)
Ограничение при объединении моделей 5 200 (значение по умолчанию)
Регулируется No No
Размер набора данных для обучения 50 МБ 50 МБ (значение по умолчанию)
Регулируется No No
Максимальное количество страниц (обучение) 500 500 (значение по умолчанию)
Регулируется No No

1 Ценовая категория "Бесплатно" (F0) также отображает ежемесячные пособия на странице цен.
2 См. рекомендации и [инструкции по корректировке(#create-and-submit-support-request).
3 Число обучающих моделей нейронных моделей сбрасывается каждый календарный месяц. Откройте запрос на поддержку, чтобы увеличить ежемесячный лимит обучения.

4 Это ограничение применяется ко всем документам, найденным в папке обучающего набора данных до любых обновлений, связанных с метками.

Подробное описание, корректировка квоты и рекомендации

Прежде чем запросить увеличение квоты (если есть такая возможность), убедитесь, что без этого не обойтись. Служба аналитики документов использует автомасштабирование для привлечения необходимых вычислительных ресурсов в "по запросу" и в то же время для снижения затрат клиента, отменяя неиспользуемые ресурсы, не поддерживая чрезмерное количество аппаратных ресурсов.

Если приложение возвращает код ответа 429 (слишком много запросов) и ваша рабочая нагрузка находится в определенных ограничениях: скорее всего, служба масштабируется до вашего спроса, но пока не достигнет требуемого масштаба. Таким образом, служба не сразу же имеет достаточно ресурсов для обслуживания запроса. Такое состояние обычно является временным и не должно длиться долго.

Общие рекомендации по предотвращению регулирования количества запросов во время автомасштабирования

Чтобы свести к минимуму количество проблем, связанных с регулированием количества запросов (код отклика 429), рекомендуется использовать следующие методы.

  • Реализация логики повторных попыток в приложении
  • Избегайте внесения резких изменений в рабочую нагрузку. Постепенное увеличение рабочей нагрузки
    Пример. Приложение использует аналитику документов, а текущая рабочая нагрузка составляет 10 TPS (транзакции в секунду). В следующую секунду вы увеличиваете нагрузку до 40 TPS (в четыре раза больше). Служба немедленно начинает масштабирование до выполнения новой нагрузки, но, скорее всего, она не может сделать это в течение секунды, поэтому некоторые запросы получают код ответа 429.

В следующих разделах описаны конкретные случаи настройки квот. Переход к аналитике документов: увеличение количества одновременных запросов

Увеличение лимита запросов на число транзакций в секунду

По умолчанию количество транзакций в секунду ограничено 15 транзакций в секунду для ресурса аналитики документов. Для ценовой категории "Стандартный" это количество можно увеличить. Перед отправкой запроса убедитесь в том, что вам знакомы материалы в этом разделе, а также эти рекомендации.

Увеличение максимального количества одновременных запросов напрямую не влияет на затраты. Служба аналитики документов использует модель "Платить только за то, что вы используете". Ограничение определяет, как высоко служба может масштабироваться перед началом регулирования запросов.

Имеющееся значение параметра "Ограничение одновременных запросов" не отображается через портал Azure, программу командной строки и запросы API. Чтобы проверить имеющееся значение, создайте запрос на поддержку Azure.

Если вы хотите увеличить транзакции в секунду, вы можете включить автоматическое масштабирование ресурса. Следуйте этому документу, чтобы включить автоматическое масштабирование ресурса * включить автоматическое масштабирование. Вы также можете отправить запрос на поддержку TPS.

Подготовьте необходимые сведения

  • Идентификатор ресурса аналитики документов

  • Регион

  • Получение сведений (базовая модель)

    • Войдите на портал Azure
    • Выберите ресурс аналитики документов, для которого требуется увеличить ограничение транзакций
    • Выберите Свойства (группа управления ресурсами).
    • Скопируйте и сохраните значения следующих полей:
      • Идентификатор ресурса
      • Расположение (регион конечной точки)

Создание и отправка запроса на поддержку

Чтобы увеличить ограничение на количество транзакций в секунду для ресурса, отправьте запрос в службу поддержки:

  • Убедитесь, что у вас имеется необходимая информация.
  • Войдите на портал Azure
  • Выберите ресурс аналитики документов, для которого требуется увеличить ограничение TPS
  • Выберите Новый запрос на поддержку (группа Поддержка и устранение неполадок).
  • Появится новое окно с автоматически заполненными сведениями о подписке Azure и ресурсе Azure
  • Введите сводку (например, "Увеличить ограничение TPS для аналитики документов")
  • В списке "Тип проблемы" выберите "Квота или проверка использования".
  • Выберите Далее: решения.
  • Продолжайте создание запроса.
  • На вкладке "Сведения" введите следующие сведения в поле "Описание ".
    • Обратите внимание, что запрос относится к квоте аналитики документов.
    • Укажите ожидаемое количество транзакций в секунду, до которого необходимо выполнить масштабирование в соответствии с вашими потребностями.
    • Сведения о ресурсах Azure, собранные ранее.
    • Завершите ввод необходимых сведений и нажмите кнопку Создать на вкладке Проверка и создание.
    • Запишите номер запроса на поддержку в уведомлениях на портале Azure. Вы обратитесь в ближайшее время за дальнейшей обработкой

Пример рекомендованного шаблона рабочей нагрузки

В этом примере представлен подход, который мы рекомендуем использовать для предотвращения возможного регулирования количества запросов в связи с выполнением автомасштабирования. Это не точный рецепт, но просто шаблон, который мы приглашаем следовать и настраивать по мере необходимости.

Предположим, что ресурс аналитики документов имеет набор ограничений по умолчанию. Запустите рабочую нагрузку для отправки запросов на анализ. Если вы наблюдаете частое срабатывание функции регулирования с кодом отклика 429, начните с реализации экспоненциальной задержки для запроса на получение ответа для анализа, используя увеличивающиеся интервалы между повторными попытками для последующих сообщений об ошибках (например, по схеме 2-5-13-34 для задержек между запросами). Как правило, мы не рекомендуем вызывать ответ на получение анализа более одного раза каждые 2 секунды для соответствующего запроса POST.

Если вы обнаружите, что количество запросов POST для отправляемых документов начинает регулироваться, попробуйте добавить задержку между запросами. Если для рабочей нагрузки требуется более высокая степень параллельной обработки, необходимо создать запрос на поддержку, чтобы увеличить ограничения службы на транзакции в секунду.

Как правило, мы рекомендуем протестировать рабочую нагрузку и шаблоны рабочей нагрузки перед переходом в рабочую среду.

Следующие шаги