Поделиться через


Развертывание и использование моделей Claude в Майкрософт Foundry (предварительная версия) (классическая версия)

В настоящее время просмотр:Классическая версия портала Foundry - Переключиться на версию нового портала Foundry

Замечание

Ссылки в этой статье могут открывать содержимое в новой документации Майкрософт Foundry вместо классической документации Foundry, которую вы просматриваете сейчас.

Модели Claude anthropic обеспечивают расширенные возможности искусственного интеллекта для Майкрософт Foundry, что позволяет создавать интеллектуальные приложения с использованием современного распознавания речи и создания. Модели Claude превосходят в сложных рассуждениях, генерации кода и многомодальных задачах, включая анализ изображений.

В этой статье вы узнаете, как:

  • Развертывание моделей Claude в Майкрософт Foundry
  • Проверка подлинности с помощью ключей Microsoft Entra ID или API
  • Вызов API claude Messages из Python, JavaScript или REST
  • Выбор подходящей модели Claude для вашего варианта использования

Модели Claude в Foundry включают:

Семейство моделей Модели
Клод Мифология claude-mythos-preview 1 (предварительная версия для закрытых исследований)
Клод Опус claude-opus-4-7 2 (предварительная версия), claude-opus-4-6 (предварительная версия), claude-opus-4-5 (предварительная версия), claude-opus-4-1
Клод Соннет claude-sonnet-4-6 (предварительная версия), claude-sonnet-4-5 (предварительная версия)
Клод Хайку claude-haiku-4-5 (предварительная версия)

1Клод Мифос Предварительный показ доступен только в качестве ограниченного доступа для исследовательского предварительного показа. Доступ к модели предоставляется исключительно по усмотрению Anthropic и отдается приоритет использованиям в защитной кибербезопасности. См. системную карточку Claude Mythos Preview для ответственного использования.

2 Следуйте инструкциям по миграции , чтобы перенести код API сообщений из предыдущих версий Claude в Claude Opus 4.7.

Дополнительные сведения о отдельных моделях см. в разделе "Доступные модели Claude".

Предпосылки

Поддержка типа подписки и региона

Чтобы использовать модели Claude в Майкрософт Foundry, необходимо иметь платную подписку Azure с биллинг-аккаунтом в стране или регионе, где Anthropic предлагает модели для покупки. Для списка распространенных ошибок, связанных с подпиской, см. раздел Распространенные сообщения об ошибках и их решения. В настоящее время следующие типы подписок не поддерживаются:

  • Корпоративные учетные записи, расположенные в Южной Корее
  • Подписки поставщиков облачных решений
  • Подписки Azure, которые не имеют активной модели оплаты по мере использования (например, студенческие подписки, бесплатные пробные версии или учетные записи с кредитами)
  • Спонсируемые подписки, использующие только кредиты Azure. Примечание: если у вас есть учетная запись с зарегистрированной кредитной картой, то списание будет производиться с кредитной карты, а не с Azure Credits.

Список поддерживаемых регионов см. в поддерживаемых географических расположениях. Обратите внимание, что политика поддерживаемых регионов Anthropic может применяться для определения доступности в вашем регионе, проверьте поддерживаемые регионы для получения более подробной информации.

Развертывание моделей Claude

Модели Claude в Foundry доступны для глобального стандартного развертывания. Чтобы развернуть модель Claude, следуйте инструкциям в разделе Deploy Майкрософт Foundry Models на портале Foundry.

После развертывания используйте игровую площадку Foundry для интерактивного тестирования модели.

Вызов API claude Messages

После развертывания модели Claude взаимодействуйте с ней для создания текстовых ответов:

  • Используйте Anthropic SDK и следующие API Claude:

    • API сообщений: отправка структурированного списка входных сообщений с текстом или содержимым изображения. Модель создает следующее сообщение в беседе.
    • API подсчета токенов: Подсчитайте количество токенов в сообщении.
    • API файлов: отправка и управление файлами для использования с API Claude без повторной отправки содержимого с каждым запросом.
    • API навыков: создайте пользовательские навыки для Claude AI.

Отправка сообщений с проверкой подлинности

В следующих примерах показано, как отправлять запросы в Claude Sonnet 4.6 с помощью проверки подлинности Microsoft Entra ID или ключа API. Чтобы работать с развернутой моделью, вам потребуется:

  • Ваш базовый URL-адрес, который имеет структуру вида https://<resource name>.services.ai.azure.com/anthropic.
  • Целевой универсальный идентификатор ресурса (URI) из сведений о развертывании, который имеет вид https://<resource name>.services.ai.azure.com/anthropic/v1/messages.
  • Microsoft Entra ID для беспключевой аутентификации или API-ключ развертывания для аутентификации через API.
  • Имя развертывания, выбранное во время создания развертывания. Это имя может отличаться от идентификатора модели.

Замечание

Для Opus 4.6 и Sonnet 4.6 параметр thinking поддерживает типы: enabled, disabledи adaptive. Тип adaptive позволяет модели решать, следует ли думать на основе сложности запросов и уровня усилий.

Для Предварительной версии Mythos параметр thinking поддерживает толькоadaptive и enabled.

Для Opus 4.7 thinking параметр поддерживает толькоadaptive и disabled.

Параметр effort , который управляет компромиссом качества и затрат для ответов, поддерживает уровни усилий: low, mediumи high. Для Opus 4.7, Opus 4.6 и Sonnet 4.6 параметр также поддерживает уровень усилий max. Используйте этот параметр с или без включения мышления.

Используйте аутентификацию Microsoft Entra ID

Для конечных точек API Messages используйте базовый URL-адрес с аутентификацией Microsoft Entra ID.

  1. Установите клиентскую библиотеку удостоверений Azure: установите эту библиотеку для использования DefaultAzureCredential. Авторизация проще всего, если использовать DefaultAzureCredential, потому что она находит лучшие учетные данные для использования в данной среде.

    pip install azure-identity
    

    Задайте значения идентификатора клиента, идентификатора клиента и секрета клиента приложения Microsoft Entra ID в качестве переменных среды: AZURE_CLIENT_ID, AZURE_TENANT_ID, AZURE_CLIENT_SECRET.

    export AZURE_CLIENT_ID="<AZURE_CLIENT_ID>"
    export AZURE_TENANT_ID="<AZURE_TENANT_ID>"
    export AZURE_CLIENT_SECRET="<AZURE_CLIENT_SECRET>"
    
  2. Установите зависимости: установите пакет SDK Anthropic с помощью pip (необходим Python 3.8 или более поздней версии).

    pip install -U "anthropic"
    
  3. Выполните базовый пример кода , чтобы выполнить следующие задачи:

    1. Создайте клиент с помощью Anthropic SDK, используя проверку подлинности Microsoft Entra ID.
    2. Выполните базовый вызов API сообщений. Вызов синхронный.
    from anthropic import AnthropicFoundry
    from azure.identity import DefaultAzureCredential, get_bearer_token_provider
    
    baseURL = "https://<resource-name>.services.ai.azure.com/anthropic" # Your base URL. Replace <resource-name> with your resource name
    deploymentName = "claude-sonnet-4-6" # Replace with your deployment name
    
    # Create token provider for Entra ID authentication
    tokenProvider = get_bearer_token_provider(
        DefaultAzureCredential(), "https://ai.azure.com/.default"
    )
    
    # Create client with Entra ID authentication
    client = AnthropicFoundry(
        azure_ad_token_provider=tokenProvider,
        base_url=baseURL
    )
    
    # Send request
    message = client.messages.create(
        model=deploymentName,
        messages=[
            {"role": "user", "content": "What are 3 things to visit in Seattle?"}
        ],
        max_tokens=1048,
        temperature=1,
        thinking={"type":"adaptive"},
        output_config={"effort": "max"},
        stream=False
    )
    
    print(message.content)
    

    Ожидаемые выходные данные: Ответ JSON, содержащий завершение текста модели с тремя рекомендациями Сиэтла.

    Reference: Пакет SDK для клиентаAnthropic, DefaultAzureCredential

Использование проверки подлинности ключа API

Это важно

Claude Mythos Preview поддерживает только проверку подлинности Microsoft Entra ID.

Для конечных точек API сообщений используйте базовый URL-адрес и ключ API для аутентификации в службе.

  1. Установка зависимостей: Установите пакет Anthropic SDK с помощью pip (требуется Python 3.8 или более поздней версии).

    pip install -U "anthropic"
    
  2. Выполните базовый пример кода , чтобы выполнить следующие задачи:

    1. Создайте клиент с Anthropic SDK, передав ваш ключ API в конфигурацию SDK. Этот метод проверки подлинности позволяет легко взаимодействовать со службой.
    2. Выполните базовый вызов API сообщений. Вызов синхронный.
    from anthropic import AnthropicFoundry
    
    baseURL = "https://<resource-name>.services.ai.azure.com/anthropic" # Your base URL. Replace <resource-name> with your resource name
    deploymentName = "claude-sonnet-4-6" # Replace with your deployment name
    apiKey = "YOUR_API_KEY" # Replace YOUR_API_KEY with your API key
    
    # Create client with API key authentication
    client = AnthropicFoundry(
        api_key=apiKey,
        base_url=baseURL
    )
    
    # Send request
    message = client.messages.create(
        model=deploymentName,
        messages=[
            {"role": "user", "content": "What are 3 things to visit in Seattle?"}
        ],
        max_tokens=1048,
        temperature=1,
        thinking={"type":"adaptive"},
        output_config={"effort": "max"},
        stream=False
    )
    
    print(message.content)
    

    Ожидаемые выходные данные: Ответ JSON, содержащий завершение текста модели с тремя рекомендациями Сиэтла.

    Ссылка:Anthropic Client SDK

Доступные модели Claude

Foundry поддерживает модели Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Opus 4.5, Claude Opus 4.1, Claude Sonnet 4.6, Claude Sonnet 4.5 и Claude Haiku 4.5 через стандартное глобальное развертывание. Эти модели имеют ключевые возможности:

  • Адаптивное мышление: обновление до расширенного мышления, которое дает Клоду свободу думать столько или меньше, сколько необходимо в зависимости от задачи и уровня усилий.
  • Расширенное мышление: улучшенное рассуждение для сложных задач.
  • Входные данные изображения и текста: мощные возможности для анализа диаграмм, графиков, технических схем, отчетов и других визуальных ресурсов.
  • Создание кода: расширенное создание кода, анализ и отладка.

Дополнительные сведения о возможностях модели см. в разделе о возможностях моделей Claude.

Claude Mythos (закрытый предварительный обзор исследований)

Это важно

Claude Mythos Preview доступен только в качестве закрытого предварительного просмотра исследований. Доступ к модели предоставляется исключительно по усмотрению Anthropic и отдается приоритет использованиям в защитной кибербезопасности. См. системную карточку Claude Mythos Preview для ответственного использования.

Claude Mythos Preview поддерживает только проверку подлинности Microsoft Entra ID.

Claude Mythos Preview — это новый класс интеллекта, созданный для амбициозных проектов, и лучшая модель в мире для кибербезопасности, автономного кодирования и долгосрочных агентов. Доступно только в качестве гейтированной предварительной версии исследования с приоритетом доступа для случаев использования защиты в области кибербезопасности. С контекстным окном с 1M токенов и максимальной длиной вывода 128K, предварительная версия Claude Mythos Preview предназначена для:

  • Кибербезопасность: лучшая в мире модель оборонительной безопасности. Он может найти и предложить исправления для реальных уязвимостей в рабочих базах кода, а затем помочь подтвердить удержание исправлений.
  • Автономное программирование: обрабатывает полный цикл разработки более эффективно, чем любая из предыдущих моделей— исследование, реализация и тестирование в больших базах кода от цели до отправки.
  • Длительные агенты: задают новый стандарт для агентской работы с длинным горизонтом. Он может поддерживать согласованное выполнение при выполнении расширенных, многочасовых задач, адаптируется по мере изменения условий и продвигает работу вперед с меньшими вмешательствами.

Claude Mythos Preview поддерживает адаптивное мышление, обновление до расширенного мышления, которое дает Клоду свободу думать столько или меньше, сколько необходимо в зависимости от задачи и уровня усилий.

Клод Opus 4.7 (предварительная версия)

Подсказка

Следуйте инструкциям по миграции , чтобы перенести код API сообщений из предыдущих версий Claude в Claude Opus 4.7.

Клод Opus 4.7 является самой мощной моделью в семействе Claude Opus, продвигающей производительность в кодировании, рабочих процессах в корпоративной среде и долговременных автономных задачах. Благодаря окну контекста 1M токенов и максимальному выводу 128K Opus 4.7 идеально подходит для агентного кодирования, работы с корпоративными знаниями, длительных рабочих процессов с несколькими инструментами, мультимодального рассуждения с высоким разрешением (до 2576 пикселей / 3,75 МП), финансового анализа и кибербезопасности. Opus 4.7 поддерживает адаптивное мышление, обновление до расширенного мышления, которое дает Клоду свободу думать столько или меньше, сколько необходимо в зависимости от задачи и уровня усилий.

Клод Opus 4.6 (предварительная версия)

Клод Opus 4.6 — это высокоспособная модель в семействе Claude Opus для написания кода, корпоративных агентов и профессиональной работы. Благодаря контекстному окну на 1M токенов и максимальному размеру вывода 128K, Opus 4.6 идеально подходит для производственного кода, сложных агентов, офисных задач, финансового анализа, кибербезопасности и работы с компьютером.

Клод Опус 4.5 (предварительный просмотр)

Клод Opus 4.5 является лидером отрасли в программировании, агентах, использовании компьютера и корпоративных рабочих процессах. Благодаря оконной контекста на 200 тыс. токенов и максимальному выводу 64K, Opus 4.5 идеально подходит для производственного кода, сложных агентов, офисных задач, финансового анализа, кибербезопасности и задач, связанных с использованием компьютера.

Клод Опус 4.1 (предварительная версия)

Claude Opus 4.1 является лидером в индустрии программирования. Она обеспечивает устойчивую производительность для длительных задач, требующих сосредоточенных усилий и тысяч шагов, значительно расширяя возможности решения агентов ИИ.

Клод Соннет 4.6 (предварительная версия)

Клод Соннет 4.6 обеспечивает масштабируемую аналитику границ, созданную для программирования, агентов и корпоративных рабочих процессов. С контекстным окном в 1 миллион токенов и максимальным выходом 128K Sonnet 4.6 идеально подходит для написания кода, работы агентов, офисных задач, финансового анализа, кибербезопасности и работы с компьютером.

Клод Соннет 4.5 (предварительная версия)

Клод Соннет 4.5 — это высокопроизводительная модель, предназначенная для создания реальных агентов и обработки сложных, долгосрочных задач. Он обеспечивает сильный баланс скорости и стоимости для вариантов использования с большим объемом. Sonnet 4.5 также обеспечивает расширенную точность использования компьютера, что позволяет разработчикам направлять Клод использовать компьютеры так, как люди делают.

Клод Хайку 4.5 (предварительная версия)

Claude Haiku 4.5 обеспечивает практически передовую производительность для широкого спектра вариантов использования. Он выделяется как одна из лучших моделей программирования и агентов, с оптимальной скоростью и стоимостью для поддержки бесплатных продуктов и масштабируемых субагентов.

Расширенные функции и возможности моделей Claude

Claude в модели Foundry поддерживает расширенные функции и возможности. Основные возможности повышают основные возможности Клода для обработки, анализа и создания содержимого в различных форматах и вариантах использования. Средства позволяют Claude взаимодействовать с внешними системами, выполнять код и выполнять автоматизированные задачи с помощью различных интерфейсов инструментов.

Ниже приведены некоторые основные возможности , поддерживаемые Foundry:

  • Большое окно контекста: Расширенное окно контекста, которое обрабатывает более крупные документы и более длинные беседы.

  • Навыки агента: Расширьте возможности Клода с помощью навыков.

  • Цитаты: Ответы Клода в исходных документах.

  • Редактирование контекста: Автоматическое управление контекстом беседы с помощью настраиваемых стратегий.

  • Расширенное мышление: Расширенные возможности рассудок для сложных задач, доступных со всеми моделями Claude.

    Подсказка

    Для Opus 4.6 и Sonnet 4.6 параметр thinking поддерживает типы: enabled, disabledи adaptive. Тип adaptive позволяет модели решать, следует ли думать на основе сложности запросов и уровня усилий.

    Для Предварительной версии Mythos параметр thinking поддерживает толькоadaptive и enabled.

    Для Opus 4.7 thinking параметр поддерживает толькоadaptive и disabled.

  • Усилия: Возможность управлять компромиссом между качеством и стоимостью в ответах.

    Подсказка

    Параметр effort поддерживает уровни усилий: low, mediumи high. Параметр для Opus 4.7, Opus 4.6 и Sonnet 4.6 также поддерживает уровень усилий max. Используйте этот параметр с или без включения мышления.

  • Поддержка PDF: Обработка и анализ текста и визуального содержимого из pdf-документов.

  • Кэширование запросов: Предоставьте Клоду дополнительные знания о фоновом опыте и примеры выходных данных, чтобы снизить затраты и задержку.

Ниже перечислены некоторые средства , поддерживаемые Foundry:

  • Соединитель MCP: Подключитесь к удаленным серверам MCP непосредственно из API сообщений без отдельного клиента MCP.
  • Память: Хранить и извлекать информацию между беседами. Создавайте базы знаний постепенно, сохраняйте контекст проекта и учитесь на прошлых взаимодействиях.
  • Веб-получение: Получение полного содержимого из указанных веб-страниц и PDF-документов для подробного анализа.

Полный список поддерживаемых возможностей и инструментов см. в обзоре функций Claude.

Поддержка агента

Квоты и ограничения API

Это важно

В настоящее время только подписки Enterprise и MCA-E имеют право на использование модели Claude в Foundry.

Модели Claude в Foundry имеют следующие ограничения скорости, измеряемые в токенах в минуту (TPM) и запросах в минуту (RPM):

Модель Тип развертывания Rpm по умолчанию TPM по умолчанию Корпоративный и MCA-E RPM Корпоративный и MCA-E TPM
claude-opus-4-7 Глобальный стандарт 0 0 2 000 2,000,000
claude-opus-4-6 Глобальный стандарт 0 0 2 000 2,000,000
claude-opus-4-5 Глобальный стандарт 0 0 2 000 2,000,000
claude-opus-4-1 Глобальный стандарт 0 0 2 000 2,000,000
claude-sonnet-4-6 Глобальный стандарт 0 0 2 000 2,000,000
claude-sonnet-4-5 Глобальный стандарт 0 0 4,000 2,000,000
claude-haiku-4-5 Глобальный стандарт 0 0 4,000 4,000,000

Чтобы увеличить квоту за пределами ограничений по умолчанию, отправьте запрос с помощью формы запроса на увеличение квоты.

Рекомендации по ограничению скорости

Чтобы оптимизировать использование и избежать ограничения скорости, выполните приведенные ниже действия.

  • Реализуйте логику повторных попыток: обработка ответов с кодом 429 с экспоненциальным отступлением.
  • Пакетные запросы. Объединение нескольких запросов по возможности.
  • Мониторинг использования: отслеживание использования токенов и шаблонов запросов.
  • Используйте соответствующие модели: выберите подходящую модель Claude для вашего варианта использования.

Рекомендации по ответственному использованию искусственного интеллекта

При использовании моделей Claude в Foundry рассмотрите следующие ответственные методики ИИ:

Лучшие практики

Следуйте приведенным ниже рекомендациям при работе с моделями Claude в Foundry:

Выбор модели

Выберите соответствующую модель Claude на основе конкретных требований:

  • Claude Mythos Preview: для защитных мер кибербезопасности, автономного программирования и длительно работающих агентов.
  • Claude Opus 4.7: наиболее способная модель для написания кода, корпоративных рабочих процессов и длительных задач агента.
  • Клод Opus 4.6: высокопроизводительная модель для разработки агентов, программирования и корпоративных рабочих процессов.
  • Claude Opus 4.5: оптимальная производительность в коде, агентах, использовании компьютера и корпоративных рабочих процессах.
  • Клод Opus 4.1: сложное рассуждение и программные приложения.
  • Клод Соннет 4.6. Аналитика границ в масштабе для кодирования, агентов и большинства вариантов использования.
  • Claude Sonnet 4.5: баланс производительности и возможностей, рабочих процессов.
  • Клод Хайку 4.5: оптимизация скорости и затрат, обработка больших объемов.

Инженерия подсказок

  • Четкие инструкции. Укажите конкретные и подробные запросы.
  • Управление контекстом: эффективно используйте доступное окно контекста.
  • Определения ролей: используйте системные сообщения для определения роли и поведения помощника.
  • Структурированные запросы: используйте согласованное форматирование для улучшения результатов.

Оптимизация затрат

  • Управление маркерами: мониторинг и оптимизация использования маркеров.
  • Выбор модели. Используйте наиболее эффективную модель для вашего варианта использования.
  • Кэширование. Реализуйте явное кэширование запросов , если это необходимо.
  • Пакетная обработка запросов: объединение нескольких запросов по возможности.

Устранение неполадок

В следующей таблице перечислены распространенные ошибки при работе с моделями Claude в Foundry и их решениях:

Ошибка Причина Решение
401 — не авторизовано Недопустимый или истёкший ключ API, или неправильная область действия токена Entra ID. Проверьте правильность ключа API. Для Entra ID убедитесь, что вы используете область https://ai.azure.com/.default.
403 Запрещено Недостаточно разрешений на ресурс или подписку. Убедитесь, что у вас есть роль участника или владельца в группе ресурсов. Для Entra ID убедитесь, что назначена роль Cognitive Services User.
404 Не найдено Неверный URL-адрес конечной точки или имя развертывания. Убедитесь, что базовый URL-адрес следует шаблону https://<resource-name>.services.ai.azure.com/anthropic, а имя развертывания соответствует конфигурации.
429 — слишком много запросов Превышено ограничение скорости для уровня подписки. Реализуйте экспоненциальный откат с помощью логики повторных попыток. Рассмотрите возможность уменьшения частоты запросов или запроса увеличения квоты.
Ошибка права на подписку Некорпоративная или не MCA-E подписка. Для моделей Claude требуется подписка Enterprise или MCA-E. Дополнительные сведения см. в квотах и ограничениях API .
Регион недоступен Попытка развертывания в неподдерживаемом регионе. Разверните в восточный регион США 2 или Центральная Швеция, регионы, поддерживаемые для моделей Claude.