Ограничения служб ИИ автомасштабирования
В этой статье приводятся рекомендации по доступу клиентов к более высоким ограничениям скорости для ресурсов служб искусственного интеллекта Azure.
Обзор
Каждый ресурс служб искусственного интеллекта Azure имеет предварительно настроенную статическую частоту вызовов (транзакции в секунду), которая ограничивает количество одновременных вызовов, которые клиенты могут выполнять в серверную службу в заданном интервале времени. Функция автомасштабирования автоматически увеличивает или уменьшает ограничения интенсивности ресурса клиента на основе метрик использования ресурсов и метрик емкости серверной службы почти в реальном времени.
Начало работы с функцией автомасштабирования
Эта функция по умолчанию отключена для каждого нового ресурса. Чтобы включить ее, следуйте этим инструкциям.
Перейдите на страницу ресурса на портале Azure и откройте вкладку Обзор в области слева. В разделе Основные компоненты найдите строку Автомасштабирование и перейдите по ссылке, чтобы просмотреть область Параметры автомасштабирования и включить эту функцию.
Часто задаваемые вопросы
Означает ли включение функции автомасштабирования, что мой ресурс больше не будет сталкиваться с ограничениями?
Нет, вы по-прежнему можете получить ошибки 429
, связанные с превышением ограничения интенсивности. Если приложение активирует всплеск, а ресурс сообщает 429
ответ, автомасштабирование проверяет доступный раздел проекции емкости, чтобы узнать, может ли текущая емкость обеспечить увеличение скорости и ответить в течение пяти минут.
Если доступной емкости достаточно для увеличения, автомасштабирование постепенно увеличивает ограничение скорости ресурса. Если вы продолжаете вызывать ресурс с высокой интенсивностью, которая приводит к увеличению регулирования 429
, скорость TPS продолжит увеличиваться с течением времени. Если это действие продолжается в течение одного часа или более, вы должны достичь максимальной скорости (до 1000 TPS), доступной в настоящее время для этого ресурса.
Если доступной емкости недостаточно для увеличения, функция автомасштабирования ожидает пять минут и снова проверяет.
Что делать, если требуется более высокое ограничение интенсивности по умолчанию?
По умолчанию ресурсы служб ИИ Azure имеют ограничение скорости по умолчанию в 10 TPS. Если требуется более высокое TPS по умолчанию, отправьте запрос, перейдя по ссылке Новый запрос на поддержку на странице ресурса на портале Azure. Не забудьте включить в запрос бизнес-обоснование.
Увеличит ли эта функция затраты на Azure?
Цены на службы искусственного интеллекта Azure не изменились и доступны здесь. Мы будем выставлять счета только за успешные вызовы, выполненные в API служб искусственного интеллекта Azure. Однако увеличение ограничений частоты звонков означает, что больше транзакций завершено, и вы можете получить более высокий счет.
Помните о потенциальных ошибках и их последствиях. Если ошибка в клиентском приложении приводит к тому, что оно вызывает службу сотни раз в секунду, это, скорее всего, станет причиной счета на гораздо большую сумму, в то время как стоимость будет гораздо более ограничена в соответствии с фиксированным ограничением интенсивности. Ошибки такого рода являются вашей ответственностью. Мы настоятельно рекомендуем выполнять тесты на разработку и обновление клиента для ресурса с фиксированным ограничением скорости перед использованием функции автомасштабирования.
Можно ли отключить эту функцию, если я предпочитаю ограничение интенсивности непредсказуемым затратам?
Да, можно отключить функцию автомасштабирования можно на портале Azure или в интерфейсе командной строки и вернуться к параметру ограничения интенсивности вызовов по умолчанию. Если ресурс был ранее утвержден для более высокого уровня TPS по умолчанию, он возвращается к этой частоте. Вступление изменений в силу может занять до пяти минут.
Какие службы поддерживают функцию автомасштабирования?
Функция автомасштабирования доступна для следующих служб.
- Визуальное распознавание искусственного интеллекта Azure
- Язык (доступен только для анализа тональности, извлечения ключевых фраз, распознавания именованных сущностей и анализа текста на предмет работоспособности)
- Детектор аномалий
- Content Moderator
- Пользовательское визуальное распознавание (прогнозирование)
- Иммерсивное средство чтения
- LUIS
- Помощник по метрикам
- Персонализатор
- QnAMaker
- Аналитика документов
Можно ли протестировать эту функцию в бесплатной подписке?
Нет, функция автомасштабирования недоступна для бесплатных подписок уровня.
Следующие шаги
- Планирование и управление затратами для служб ИИ Azure.
- Оптимизация инвестиций в облако с помощью Управления затратами Azure
- Узнайте, как предотвратить непредвиденные затраты.
- Пройдите интерактивный курс обучения по управлению затратами.