Цены и выставление счетов для агента Azure SRE

Узнайте, как работает выставление счетов агентом Azure SRE и что ожидать в счете Azure.

Существуют два компонента выставления счетов: фиксированный, всегда включенный поток и активный поток с переменными и маркерами. Активный поток измеряет токены крупной языковой модели (LLM), которые использует ваш агент. Каждый тип токена рассчитывается по фиксированной ставке единиц агента Azure (AAU) на основе модели, настроенной для вашего агента.

Вы можете отслеживать потребление на портале в разделе Параметры>Потребление агента.

Как работает выставление счетов

Плата за агент Azure SRE основана на единицах AAU, стандартизованной мере агентного процесса, используемой для всех готовых агентов Azure. Ежемесячный счет включает два типа платежей: постоянный поток и активный поток.

Постоянно включенный поток (фиксированная стоимость)

Когда агент создан, плата взимается по фиксированной ставке на весь период его существования.

Компонент Ставка
Постоянно действующий поток Четыре AAUs на час агента

Поток Always-on не означает, что агент обрабатывает задание в данный момент. Она представляет базовые затраты на поддержание подготовки и доступности агента. Выставление счетов в режиме «всегда включено» продолжается с момента создания агента до его удаления.

Активный поток (переменная стоимость)

Каждый раз, когда агент выполняет работу, агент использует активный поток AAUs. Примеры работы могут включать в себя интерактивное задание вопроса пользователем, инициирование задачи автоматизацией или асинхронную операцию, запускающуюся в фоновом режиме. В любое время, когда агент активно обрабатывает, это считается активным потоком, независимо от того, как была инициирована работа.

Как токены становятся AAUs

Каждый раз, когда ваш агент выполняет работу, он потребляет токены LLM. Каждый тип токена измеряется отдельно по скорости, показанной в следующей таблице.

Тип токена Что он измеряет
Ввод Маркеры, отправленные в модель (запросы, результаты инструментов и контекст).
Выходные данные Токены, созданные моделью (ответы и рассуждения).
Чтение кэша Токены, полученные из кэша подсказок (повторяющийся контекст).
Запись кэша Токены, записанные для запроса кэша для дальнейшего повторного использования.

Общий активный поток AAUs для задачи равен сумме единиц AAU для всех четырех типов токенов.

Ставки AAU по модели

В следующей таблице показано количество единиц AAUs, потребляемых на 1 миллион токенов.

Модель Ввод Выходные данные Чтение кэша Запись кэша
Клод Опус 4.6 100 единиц AAUs 500 единиц AAUs 10 AAUs 125 AAUs
Кодекс GPT 5.3 35 единиц AAUs 280 единиц ААЕ 3.5 AAUs
GPT 5.2 35 единиц AAUs 280 единиц ААЕ 3.5 AAUs

Тарифы указаны за 1 миллион токенов. Действует 15 апреля 2026 г. В будущем могут быть добавлены дополнительные модели и поставщики. Тарифы AAU задаются Azure и могут быть обновлены по мере выпуска новых моделей.

Ключевые сведения

  • Только время обработки учитывается: Время, которое агент тратит на ожидание вашего ответа, не выставляется как активный процесс.
  • Счетчик активности обнуляется ежемесячно: Счетчик расхода для ваших AAUs обнуляется в начале каждого месяца.
  • Поставщик устанавливается на уровне агента: Поставщик модели (Anthropic, OpenAI и другие) настраивается в параметрах агента. Соответствующая модель определяет ставки AAU.

Активный поток по типу задачи

Количество потребляемых токенов, которые определяют выставление счетов в АЕ, зависит от сложности задачи. Для более сложных задач требуется больше шагов рассуждения LLM, вызовов инструментов и обработки данных, что означает больше токенов.

В следующей таблице показано, как потребление токенов преобразуется в AAUs в распространённых сценариях.

Сценарий Входные токены Результирующие токены Чтение кэша Запись кэша Клод Opus 4.6 AAUs GPT 5.3 Codex AAUs Пример
Быстрый вопрос около 20К ~2K ~15K ~5K ~3.8 ~1.6 "Показать мне последние оповещения".
Исследование инцидента ~200K ~15K ~150K ~50K ~35.5 ~13.7 Автоматический инцидент из Azure Monitor.
Полное исправление ~500 тыс. ~40K ~400K ~100 тыс. ~86.5 ~33.9 "Диагностика и исправление сбоя развертывания".

Как работает математика

В следующей таблице показаны вычисления для предыдущего примера Claude Opus 4.6 с использованием чисел из строки быстрого вопроса.

Тип токена Токены Ставка на миллион AAUs
Ввод 20К 100 2.0
Выходные данные 2K 500 1.0
Чтение кэша 15K 10 0.15
Запись кэша 5K 125 0.625
Total 3.775 AAUs

Подсказка

Чтобы обеспечить прогнозируемые затраты на активный поток, задайте ежемесячный предел распределения AAU в Параметры>Потребление агента.

Мониторинг затрат

На портале агента SRE

Перейдите в Настройки>Использование агента, чтобы просмотреть использование:

  • Ежемесячное ограничение AAU: Отображает совокупное распределение для постоянно доступного и активного потока.
  • Общее потребление активного потока: Отображает полоску прогресса, которая сравнивает текущее использование с лимитом.
  • Ежедневное потребление активного потока: Отображает линейчатую диаграмму, показывющую использование AAU в день за текущий месяц.
  • Разбивка использования токенов: Отображает общий объем токенов, потребляемых по категориям (ввод, вывод, чтение кэша и запись в кэш), чтобы вы могли точно увидеть, куда расходуются ваши AAU.

Установка ограничения расходов на активный поток

Выберите "Изменить выделение AAU" , чтобы задать ежемесячное ограничение AAU активного потока (до 1 миллиона единиц AAU). Это ограничение применяется только к активному потоку. Выставление счетов в режиме непрерывного действия продолжается до тех пор, пока агент существует.

  • Когда агент достигает ограничения активного потока, он становится недоступным для чата и действий до следующего месяца. Плата за постоянное подключение продолжается до конца месяца.
  • Вы можете в любое время увеличить или уменьшить выделение.

Влияние действий на выставление счетов

Действие Активный поток всегда включен Возобновить в следующем месяце
Установка ограничения бюджета (достижение лимита) Останавливается По-прежнему выставляется счет Автоматически сбрасывается в начале месяца.
Остановить агент Останавливается По-прежнему выставляется счет Вручную выберите Пуск в Параметры>Основы.
Удаление агента Останавливается Останавливается Создайте новый агент.

Управление затратами Майкрософт

Для получения подробных разбивок по выставлению счетов по нескольким агентам и ресурсам используйте Microsoft Cost Management на портале Azure.

Советы по оптимизации затрат

Стратегия Влияние Как это сделать
Добавьте сведения к вашему агенту. Экономит меньше токенов. Добавьте навыки, знания и документы, чтобы агент оставался приземленным и кратким. Постоянная память из прошлых взаимодействий повышает эффективность с течением времени.
Фильтрация инцидентов с помощью планов реагирования. Уменьшает ненужные трудоемкие операции. Используйте планы ответа для фильтрации оповещений Azure Monitor по серьезности, службе или ключевому слову. Агент исследует только инциденты, которые соответствуют критериям.
Пакетная работа с запланированными задачами. Делает меньше запусков. Запланируйте выполнение задач ежедневно или еженедельно вместо непрерывного опроса.
Протестируйте в чате перед автоматизацией. Избегает ненужных запусков. Сначала попробуйте ваш запрос в чате или в песочнице. Неправильно настроенная автоматизация многократно выполняется и истощает ресурсы, измеряемые в AAU.
Остановите бездействующих агентов. Устраняет активный поток. Перейдите в раздел "Основы параметров>" и нажмите кнопку "Остановить". Агент сохраняет свою конфигурацию, но останавливает весь активный поток. Стоимость за непрерывное использование взимается до момента удаления.
Удаление неиспользуемых агентов. Устраняет все затраты. На веб-странице агента Azure SRE откройте агент и перейдите в раздел Настройки>Основные>Удаление агента. Все выставление счетов останавливается немедленно.

Часто задаваемые вопросы

Как агент вычисляет AAUs из токенов?

Каждый раз, когда агент выполняет работу, он отслеживает токены LLM, используемые во всех четырех типах токенов, и измеряет их по ставкам AAU для настроенной модели. Вы можете просмотреть потребление AAU в параметрах>использовании агента.

Влияет ли поставщик на мои затраты?

Поставщик модели (Anthropic, OpenAI и другие) устанавливается на уровне агента и определяет, какие ставки AAU применяются. Разные модели имеют разные ставки. Сведения о текущих ставках см. в таблице ставок AAU.

Какую модель следует выбрать?

Клод Opus 4.6 отличается высокими показателями AAU, но обычно проводит более тщательные исследования с меньшим количеством шагов рассуждений. Для сложных расследований инцидентов и анализа первопричин Opus часто приходит к заключению с меньшим числом обращений к инструментам, что может компенсировать более высокую ставку за токен.

Модели GPT являются хорошим выбором для более простых, больших объемных задач, таких как запланированные проверки соответствия, где эффективность затрат имеет больше, чем глубина. Поставщика моделей можно изменить в любое время в настройках>Основы и сравнить результаты.

Взимается ли плата, когда агент ждет меня ответить?

Нет. Только время, которое агент проводит на активной обработке задачи, учитывается как активный поток. Если агент запрашивает утверждение и ожидает, время ожидания не учитывается.

Что считается активным потоком?

В любой момент, когда агент активно выполняет работу, учитывается как активный поток, например в следующих примерах:

  • Интерактивные запросы: пользователь, задающий агенту вопрос в чате.
  • Автоматизация: запланированные задачи, планы реагирования на инциденты или другие автоматизированные триггеры.
  • Асинхронные операции: фоновые исследования, создание отчетов или задачи исправления.

Во всех случаях агент измеряет потребленные токены в качестве AAU.

Что произойдет, если остановить агент?

Остановленный агент не может отслеживать ресурсы или отвечать на запросы, но он по-прежнему несет фиксированные постоянные затраты. Активный поток AAUs не используется, когда он остановлен. Чтобы остановить агента, перейдите в Настройки>Основные и выберите Остановить. Чтобы возобновить, выберите "Пуск" с той же страницы. Чтобы полностью остановить все выставление счетов, удалите агент.

Может ли один агент обрабатывать несколько рабочих нагрузок?

Да. Один агент может отслеживать несколько ресурсов в заданной области. Консолидация рабочих нагрузок под одним агентом снижает постоянные затраты по сравнению с установкой отдельных агентов.

Существует ли бесплатный уровень?

Нет. Плата за агента Azure SRE взимается с момента его создания. Сведения о текущих ставках см. в калькуляторе цен Azure.

Совпадает ли цена во всех регионах?

Сведения о текущих ценах в вашем регионе см. в калькуляторе цен Azure.