Поделиться через


Планирование затрат на Microsoft Foundry и управление ими

В этой статье показано, как оценить расходы перед развертыванием, отслеживать расходы в режиме реального времени и настраивать оповещения, чтобы избежать сюрпризов бюджета.

Предпосылки

Прежде чем начать, убедитесь, что у вас есть следующее:

  • Azure subscription: Активная подписка Azure с ресурсами, которые требуется отслеживать.
  • Контроль доступа на основе ролей (RBAC): Одна или обе следующие роли в области подписки или группы ресурсов:
  • Поддерживаемый тип учетной записи Azure: Один из типов учетных записей, поддерживаемых для управления затратами.

Если вам нужно предоставить эти роли участникам команды, см. статью Предоставление доступа к данным управления затратами и Роли RBAC в Foundry.

Замечание

Foundry не имеет выделенной страницы в калькуляторе цен Azure, так как Foundry состоит из нескольких необязательных служб Azure. В этой статье показано, как с помощью калькулятора оценить затраты на эти службы.

Оцените затраты перед использованием Foundry

Используйте калькулятор цен Azure, чтобы оценить затраты перед добавлением ресурсов Foundry.

  1. Перейдите к калькулятору цен Azure.
  2. Найдите и выберите продукт, например Azure Speech в Foundry или Azure Language в Foundry.
  3. Выберите дополнительные продукты, чтобы оценить затраты на несколько служб. Например, добавьте Azure AI Search для включения потенциальных затрат на поиск.
  4. При добавлении ресурсов в проект возвращайтесь к калькулятору и обновляйте оценки.

Reference:калькулятор стоимости Azure

Затраты, связанные с Foundry

При создании ресурса Foundry вы платите за используемые службы Azure, такие как Azure OpenAI, Azure speech in Foundry, Content Safety, Azure Vision in Foundry, Azure Document Intelligence и Azure Language in Foundry. Затраты зависят от службы и функции. Дополнительные сведения см. на странице цен на Foundry Tools.

Общие сведения о моделях выставления счетов для Foundry

Ресурсы Foundry выполняются в инфраструктуре Azure и накапливают стоимость при развертывании. При создании или использовании ресурсов Foundry взимается плата на основе используемых сервисов.

Доступны две модели выставления счетов:

  • Pay-as-you-go (бессерверный API): счета выставляются в соответствии с использованием каждой службы Azure.
  • Уровни обязательств: Вы обязуетесь использовать функции службы за фиксированную плату, что обеспечивает прогнозируемые затраты. Дополнительные сведения см. в разделе Ценовая категория тарифов по обязательствам.

Замечание

Если вы используете ресурс выше квоты, предоставленной планом обязательств, вы платите за дополнительное использование, как описано в сумме избыточности в Azure portal при покупке плана обязательств.

Общие сведения о модели выставления счетов для моделей Foundry

Цены на основе токенов

Модели языка и зрения обрабатывают входные данные, разбивая их на маркеры. Каждый маркер составляет примерно четыре символа текста; Изображение и звуковое содержимое также преобразуются в маркеры для выставления счетов. Плата взимается за 1000 токенов (входные и выходные данные вместе). Цены на токены зависят от ряда моделей и типа развертывания. Последние тарифы см. на странице ценообразования Azure OpenAI.

Модели, проданные непосредственно Azure

Модели, которые продает платформа Azure (включая Azure OpenAI), отображаются как счетчики оплаты в каждом ресурсе Foundry. Корпорация Майкрософт самостоятельно осуществляет выставление счетов. Вы видите отдельные счетчики для использования входных и выходных данных каждой модели.

Точно настроенные модели

Модели OpenAI с тонкой настройкой в Azure оплачиваются тремя способами:

  • Обучение: Плата за каждый токен в обучающем файле.
  • Хостинг: Почасовая стоимость на развернутую модель (применяется, даже если модель не используется).
  • Вывод: На 1000 токенов (входных и выходных) при вызове модели.

Внимательно отслеживайте затраты на размещённую доработанную модель, чтобы избежать непредвиденных расходов. Сведения о текущих ставках см. на странице цен на Azure OpenAI.

Это важно

Неактивные развертывания (неиспользуемые в течение 15 дней подряд) удаляются автоматически. Это удаление не влияет на базовую модель; вы можете повторно развернуть его в любое время. Однако развернутые точно настроенные модели влекут за собой почасовые затраты на хостинг, даже если они неактивны, поэтому удалите неиспользуемые развертывания, чтобы контролировать затраты.

Код ответа на ошибки HTTP и состояние выставления счетов

Если служба выполняет обработку, плата взимается даже в том случае, если код состояния не успешен (не 200). Например, ошибка 400 из-за фильтра содержимого или ограничения ввода или ошибки 408 из-за времени ожидания.

Если служба не выполняет обработку, плата не взимается. Например, ошибка 401 из-за проверки подлинности или ошибки 429 из-за превышения предела скорости.

Мониторинг затрат

Отслеживайте расходы Foundry с помощью средств анализа затрат. Вы можете просматривать затраты по дням, месяцам или годам, сравнивать с бюджетами и определять тенденции расходов.

Получите сведения о затратах на портале Microsoft Foundry или портале Azure. Справочные материалы:Анализ затрат

Это важно

Затраты на вашу платформу Foundry — это лишь часть общих затрат на приложение или решение. Необходимо отслеживать затраты на все Azure ресурсы, используемые в приложении или решении.

Настройка разрешений для просмотра затрат

Чтобы просмотреть затраты Foundry, убедитесь, что у вас есть роль пользователя AI и роль читателя управления затратами на уровне группы ресурсов или подписки.

Вы также можете создать следующие настраиваемые правила:

  • Microsoft.Consumption/*/read
  • Microsoft.CostManagement/*/read
  • Microsoft.Resources/subscriptions/read
  • Microsoft.CognitiveServices/accounts/AIServices/usage/read

Замечание

Для создания пользовательских ролей в этой области требуется роль владельца подписки или группы ресурсов.

Чтобы создать пользовательскую роль, используйте одну из следующих статей:

Дополнительные сведения о пользовательских ролях см. в разделе Azure пользовательские роли.

Чтобы создать пользовательскую роль, создайте JSON-файл определения роли, указывающий разрешение и область для роли. В следующем примере определяется пользовательская роль инструмента для чтения затрат Foundry в пределах определенного уровня ресурса:

{
    "Name": "Foundry Cost Reader",
    "IsCustom": true,
    "Description": "Can see cost metrics in Foundry",
    "Actions": [
        "Microsoft.Consumption/*/read",
        "Microsoft.CostManagement/*/read",
        "Microsoft.Resources/subscriptions/read",
        "Microsoft.CognitiveServices/accounts/AIServices/usage/read"
    ],
    "NotActions": [],
    "DataActions": [],
    "NotDataActions": [],
    "AssignableScopes": [
        "/subscriptions/<subscriptionId>/resourceGroups/<resourceGroupName>/providers/Microsoft.CognitiveServices/accounts/<foundryResourceName>"
    ]
}

Замените <subscriptionId>, <resourceGroupName>а <foundryResourceName> также фактическими значениями.

Монитор в портале Foundry

  1. Войдите в Microsoft Foundry. Убедитесь, что переключатель New Foundry включен. Эти действия относятся к Foundry (new).
  2. Используйте приведенные ниже разделы для мониторинга затрат.

Замечание

Оценки не отражают скидки или контрактные цены, которые могут появиться на окончательном счете. Оценки охватывают только стандартные затраты на развертывание, а не подготовленную пропускную способность.

Затраты на агент

  1. Выберите «Управлять» в правом верхнем углу навигации.
  2. Выберите "Обзор" в левой области.
  3. В верхней части страницы выберите подписку, один или несколько проектов и диапазон дат.
  4. На плитке Предполагаемые затраты показаны оценки всех агентов для выбранных проектов за выбранные даты. Эти оценки в настоящее время не включают затраты на оперативный агент и агента, не связанного с Foundry.

Снимок экрана: вкладка

Для оценки отдельных агентов:

  1. Выберите ресурсы в левой области.
  2. Перейдите на вкладку "Агенты ".
  3. В столбце "Предполагаемые затраты" отображаются ежемесячные оценки на основе конфигурации агента и шаблонов использования.

Ссылка:Понятия агента

Снимок экрана: вкладка

Чтобы просмотреть подробные затраты агента, выполните приведенные ниже действия.

  1. Выберите Сборка в верхней правой части панели навигации.
  2. Выберите агенты в левой области.
  3. Выберите агент.
  4. Выберите вкладку "Монитор ".
  5. Задайте диапазон дат в правом верхнем углу.
  6. Просмотр метрик затрат и использования токенов для выбранного диапазона.

Справочник:Мониторинг метрик агента

Снимок экрана страницы

Затраты на развертывание модели

  1. Выберите Сборка в верхней правой части панели навигации.
  2. Выберите модели в левой области.
  3. Выберите модель.
  4. Выберите вкладку "Монитор ".
  5. Задайте диапазон дат в правом верхнем углу. Вы увидите общую стоимость и оценочную диаграмму затрат для выбранного диапазона.

Справочник:Мониторинг моделей

Screenshot Azure portal с вкладкой

При выборе View More Details или Azure Управление затратами вы будете перенаправлены в раздел Azure portal Cost Management. Примечание. В Azure portal стоимость показана как сводные расходы для всей учетной записи Cognitive Services, а не отдельных моделей. Затраты отображаются только в долларах США.

Замечание

Диаграммы токенов и запросов иногда могут показывать более низкие значения, чем вид предполагаемой стоимости, так как события использования с задержкой поступления могут не включаться в эти диаграммы. Если имеется несоответствие, следует полагаться на предполагаемую стоимость как наиболее точное представление и обратите внимание, что ваш счет Azure по управлению затратами остается окончательным источником истины.

Мониторинг в портале Azure

  1. Войдите в Azure portal.

  2. Просмотр затрат на группу ресурсов или отдельный ресурс Foundry.

    Подсказка

    Чтобы открыть ресурс Foundry в Azure portal:

    1. Войдите в Microsoft Foundry. Убедитесь, что переключатель New Foundry включен. Эти действия относятся к Foundry (new).
    2. Выберите "Работать" в правом верхнем углу навигации.
    3. Выберите "Администратор".
    4. Выберите ссылку для родительского ресурса во втором столбце.
    5. Выберите Управление этим ресурсом в портале Azure в разделе Просмотр ресурса в правом верхнем углу.
  3. В Azure portal выберите Cost analysis в разделе Cost Management (для группы ресурсов или ресурса Foundry).

  4. Просмотрите обзор затрат. При необходимости добавьте фильтры (теги развертывания, пользовательские теги) в сегментирование затрат по развертыванию модели:

    Снимок экрана: обзор затрат, показывающий фильтр тегов уровня развертывания.

  5. Выберите затраты по ресурсам>Ресурсы, чтобы увидеть распределение затрат на ресурсы Foundry по развертыванию моделей.

    Скриншот распределения затрат ресурсов Foundry по развертываниям моделей.

Понять разбивку затрат по счетчику

Используйте средство анализа затрат для просмотра затрат, сгруппированных по счетчику выставления счетов:

  1. Войдите в Azure portal и выберите группу ресурсов.

  2. Выберите "Анализ затрат" в разделе "Управление затратами".

  3. По умолчанию анализ затрат ограничивается выбранной группой ресурсов.

    Это важно

    Анализ затрат рассматривается для группы ресурсов, в которой развернут ресурс Foundry. Счетчики затрат, связанные с моделями от Партнеров и Сообщества, отображаются в группе ресурсов вместо ресурса Foundry.

  4. Измените Группировать по на Счетчик. Теперь можно увидеть, что для этой конкретной группы ресурсов источник затрат поступает из разных рядов моделей.

    Снимок экрана: просмотр затрат по каждому счетчику в группе ресурсов.

Модели, проданные непосредственно Azure

Модели, продаваемые непосредственно через Azure (включая Azure OpenAI), имеют прямое начисление платы. Они отображаются как счетчики учета на каждом ресурсе Foundry. Корпорация Майкрософт напрямую обрабатывает это выставление счетов. При проверке счета вы увидите счетчики учета, которые подсчитывают входные и выходные параметры для каждой потребляемой модели.

Снимок экрана панели анализа затрат, в пределах группы ресурсов, в которой развернут ресурс Foundry, выделяющий счетчики для Azure OpenAI и моделей Phi. Затраты группируются по счетчику.

Мониторинг затрат по ресурсу

Дополнительные сведения о выставлении счетов можно получить, группируя затраты по ресурсу:

  1. В разделе "Анализ затрат" выберите "Просмотр>затрат по ресурсу".

    Снимок экрана: просмотр затрат по каждому ресурсу в группе ресурсов.

  2. Теперь вы увидите ресурсы, создаваемые каждым из счетчиков выставления счетов. Чтобы понять разбивку того, что составляет эти затраты, это может помочь изменить Группировать по на Счетчик и переключить тип диаграммы на Линия.

  3. Azure модели OpenAI и модели Майкрософт отображаются в виде индикаторов под каждым ресурсом средства Foundry.

  4. Некоторые модели поставщиков отображаются как счётчики в глобальных ресурсах. Слово Globalне связано с номером SKU развертывания модели (например, Global standard). Если у вас несколько ресурсов инструмента Foundry, в вашем счете будет содержаться по одной записи на каждую модель для каждого ресурса инструмента Foundry. Счетчики ресурсов имеют формат [model-name]-[GUID], где [GUID] является уникальным идентификатором, связанным с заданным ресурсом Foundry Tools. Вы заметите счетчики учета входов и выходов для каждой используемой модели.

    Screenshot панели мониторинга анализа затрат, с ограниченной областью действия для группы ресурсов, в которой развернут ресурс Foundry Tools, с выделением счетчиков для моделей, выставляемых через Azure Marketplace. Затраты группируются по ресурсу.

Важно понимать объём при оценке затрат, связанных с инструментами Foundry. Если ваши ресурсы являются частью одной и той же группы ресурсов, вы можете на этом уровне задать область для Анализа затрат, чтобы понять влияние на расходы. Если ресурсы распределяются по нескольким группам ресурсов, можно задать область действия на уровне подписки.

При более обобщённом уровне часто необходимо добавить больше фильтров, чтобы сосредоточиться на использовании Azure OpenAI. При определении области на уровне подписки вы увидите множество других ресурсов, которые могут быть не важны для вас в контексте управления затратами Azure OpenAI. Когда вы рассматриваете подписку, перейдите к полному средству анализа затрат в службе Управление затратами.

Ниже приведен пример использования средства анализа затрат для просмотра накопленных затрат для подписки или группы ресурсов:

  1. Найдите Cost Management в верхней строке поиска Azure, чтобы перейти к полному интерфейсу службы, который включает дополнительные варианты, такие как создание бюджетов.
  2. При необходимости выберите изменение , если область: не указывает на группу ресурсов или подписку, которую вы хотите проанализировать.
  3. Слева выберите Отчеты и аналитика>Анализ затрат.
  4. На вкладке "Все представления" выберите "Накопленные затраты".

Скриншот панели мониторинга анализа затрат, демонстрирующий, как получить доступ к накопленным затратам.

На панели мониторинга анализа затрат отображаются накопленные затраты, которые анализируются в зависимости от того, что вы указали для области.

Снимок экрана: панель мониторинга анализа затрат с заданной областью подписки.

Если вы пытаетесь добавить фильтр по службе, вы не можете найти Azure OpenAI в списке. Эта ситуация возникает из-за того, что Azure OpenAI имеет общую черту с подмножеством средств Foundry, где фильтр уровня обслуживания Cognitive Services. Если вы хотите просмотреть все ресурсы Azure OpenAI в подписке без других типов ресурсов Foundry Tool, вместо этого выберите уровень службы: Azure OpenAI:

Снимок экрана: панель мониторинга анализа затрат с выделенным уровнем служб.

Создание бюджетов

Предотвращайте превышение затрат с помощью автоматизированных оповещений.Создайте бюджеты, которые отслеживают ваши лимиты расходов, и настройте оповещения для уведомления о приближении или превышении затрат пороговых значений.

Бест практики: Создание бюджетов и оповещений для подписок и групп ресурсов Azure в рамках общей стратегии мониторинга затрат.

Создайте бюджеты с фильтрами для определенных ресурсов или служб в Azure, если требуется более подробная детализация в мониторинге. Фильтры помогают гарантировать, что вы не случайно создаете новые ресурсы, которые стоят больше денег. Дополнительные сведения о параметрах фильтрации при создании бюджета см. в разделе Group и параметры фильтра.

Это важно

Хотя у OpenAI есть функция жестких ограничений, которые предотвращают выход за рамки бюджета, Azure OpenAI в настоящее время не предоставляет эту возможность. Вы можете начать автоматизацию из групп действий в рамках уведомлений бюджета, чтобы выполнить более сложные действия, но эта функция требует дополнительной пользовательской разработки.

Экспорт данных о затратах

Вы можете экспортировать данные о затратах в учетную запись хранилища. Экспорт данных полезен, если вам или другим пользователям требуется провести дополнительный анализ данных для затрат. Например, finance команды могут анализировать данные с помощью Excel или Power BI. Можно экспортировать данные о затратах ежедневно, еженедельно или ежемесячно и задать настраиваемый диапазон дат. Экспорт данных по затратам — это рекомендуемый способ извлечения неагрегированных данных о затратах.

Другие затраты, которые могут начисляться

Включение таких возможностей, как отправка данных в журналы Azure Monitor и создание оповещений, влечет за собой дополнительные затраты на данные службы. Эти затраты отображаются под другими сервисами и на уровне вашей подписки, но не отображаются, если ограничены только ресурсом Foundry.

Использование предоплаты Azure

Вы можете оплатить модели, продаваемые напрямую Azure, с помощью вашего кредита предоплаты Azure (ранее называвшаяся денежным обязательством). Однако вы не можете использовать кредит Azure на предоплату для оплаты по другим моделям поставщиков, так как счёт выставляется через Azure Marketplace.

Дополнительные сведения см. в Azure калькуляторе цен.