Partager via


Déployer et utiliser des modèles Claude dans Microsoft Foundry (préversion)

Les modèles Claude d’Anthropic apportent des fonctionnalités d’IA conversationnelles avancées à Microsoft Foundry, ce qui vous permet de créer des applications intelligentes avec une compréhension et une génération de langage de pointe. Les modèles Claude excellent dans le raisonnement complexe, la génération de code et les tâches multimodales, notamment l’analyse d’images.

Dans cet article, vous allez apprendre à :

  • Déployer des modèles Claude dans Microsoft Foundry
  • S’authentifier à l’aide de l’ID Microsoft Entra ou des clés API
  • Appeler l’API Claude Messages à partir de Python, JavaScript ou REST
  • Choisir le modèle Claude approprié pour votre cas d’usage

Les modèles Claude dans Foundry sont les suivants :

Famille de modèles Models
Claude Opus claude-opus-4-6 (préversion), claude-opus-4-5 (préversion), claude-opus-4-1 (préversion)
Claude Sonnet claude-sonnet-4-6 (préversion), claude-sonnet-4-5 (préversion)
Claude Haiku claude-haiku-4-5 (préversion)

Pour en savoir plus sur les modèles individuels, consultez Modèles Claude disponibles.

Important

Pour utiliser des modèles Claude dans Microsoft Foundry, vous devez disposer d’un abonnement Azure payant avec un compte de facturation dans un pays ou une région où Anthropic propose les modèles à acheter. Les types d’abonnement suivants ne sont actuellement pas pris en charge :

  • Comptes d’entreprise situés à Singapour ou en Corée du Sud
  • Abonnements du fournisseur de solutions cloud
  • Abonnements parrainés qui utilisent des crédits Azure
  • Abonnements Azure qui n'ont pas de méthode de facturation à la consommation active (par exemple, comptes étudiant, d'essai gratuit ou basés sur des crédits de démarrage)

Pour obtenir la liste des erreurs courantes liées à l’abonnement, consultez les messages d’erreur courants et les solutions.

Prerequisites

Déployer des modèles Claude

Les modèles Claude dans Foundry sont disponibles pour le déploiement standard global. Pour déployer un modèle Claude, suivez les instructions de Deploy Microsoft Foundry Models dans le portail Foundry.

Après le déploiement, utilisez le terrain de jeu Foundry pour tester de manière interactive le modèle.

Appeler l’API Claude Messages

Après avoir déployé un modèle Claude, interagissez avec lui pour générer des réponses textuelles :

  • Utilisez les Anthropic SDK et les API Claude suivantes :

    • API Messages : envoyez une liste structurée de messages d’entrée avec du texte ou du contenu d’image. Le modèle génère le message suivant dans la conversation.
    • API Nombre de jetons : compter le nombre de jetons dans un message.
    • API Fichiers : chargez et gérez les fichiers à utiliser avec l’API Claude sans recharger le contenu avec chaque requête.
    • API compétences : Créer des compétences personnalisées pour Claude AI.

Envoyer des messages avec authentification

Les exemples suivants montrent comment envoyer des requêtes à Claude Sonnet 4.6 à l’aide de l’authentification par Microsoft Entra ID ou clé API. Pour utiliser votre modèle déployé, vous avez besoin des éléments suivants :

  • Votre URL de base, qui est de la forme https://<resource name>.services.ai.azure.com/anthropic.
  • Votre URI cible provenant des détails de votre déploiement, qui est de la forme https://<resource name>.services.ai.azure.com/anthropic/v1/messages.
  • ID Microsoft Entra pour l’authentification sans clé ou la clé API de votre déploiement pour l’authentification d’API.
  • Nom de déploiement que vous avez choisi lors de la création du déploiement. Ce nom peut être différent de l’ID de modèle.

Note

Le thinking paramètre prend en charge les types : enabled et disabled. Pour, Opus 4.6 et Sonnet 4.6, le paramètre prend également en charge le adaptive type, ce qui permet au modèle de décider s’il faut penser, en fonction de la complexité des requêtes et du niveau d’effort.

Le effort paramètre, qui contrôle le compromis qualité/coût pour les réponses, prend en charge les niveaux d’effort : low, mediumet high. Pour Opus 4.6 et Sonnet 4.6, le paramètre prend également en charge max le niveau d’effort. Utilisez ce paramètre avec ou sans activer la pensée.

Utiliser l’authentification Microsoft Entra ID

Pour les points de terminaison de l’API Messages, utilisez votre URL de base avec l’authentification Microsoft Entra ID.

  1. Installez la bibliothèque de client Azure Identity : installez cette bibliothèque pour utiliser le DefaultAzureCredential. L’autorisation est la plus simple lorsque vous utilisez DefaultAzureCredential , car elle trouve les meilleures informations d’identification à utiliser dans son environnement en cours d’exécution.

    pip install azure-identity
    

    Définissez les valeurs de l’ID client, de l’ID de locataire et de la clé secrète client de l’application Microsoft Entra ID en tant que variables d’environnement : AZURE_CLIENT_ID, AZURE_TENANT_IDAZURE_CLIENT_SECRET.

    export AZURE_CLIENT_ID="<AZURE_CLIENT_ID>"
    export AZURE_TENANT_ID="<AZURE_TENANT_ID>"
    export AZURE_CLIENT_SECRET="<AZURE_CLIENT_SECRET>"
    
  2. Installez les dépendances : installez le Kit de développement logiciel (SDK) Anthropic à l’aide de pip (nécessite Python 3.8 ou version ultérieure).

    pip install -U "anthropic"
    
  3. Exécutez un exemple de code de base pour effectuer les tâches suivantes :

    1. Créez un client avec le Kit de développement logiciel (SDK) Anthropic, à l’aide de l’authentification Microsoft Entra ID.
    2. Effectuez un appel de base à l’API Messages. L’appel est synchrone.
    from anthropic import AnthropicFoundry
    from azure.identity import DefaultAzureCredential, get_bearer_token_provider
    
    baseURL = "https://<resource-name>.services.ai.azure.com/anthropic" # Your base URL. Replace <resource-name> with your resource name
    deploymentName = "claude-sonnet-4-6" # Replace with your deployment name
    
    # Create token provider for Entra ID authentication
    tokenProvider = get_bearer_token_provider(
        DefaultAzureCredential(), "https://cognitiveservices.azure.com/.default"
    )
    
    # Create client with Entra ID authentication
    client = AnthropicFoundry(
        azure_ad_token_provider=tokenProvider,
        base_url=baseURL
    )
    
    # Send request
    message = client.messages.create(
        model=deploymentName,
        messages=[
            {"role": "user", "content": "What are 3 things to visit in Seattle?"}
        ],
        max_tokens=1048,
        temperature=1,
        thinking={"type":"adaptive"},
        output_config={"effort": "max"},
        stream=False
    )
    
    print(message.content)
    

    Sortie attendue : Réponse JSON contenant la complétion de texte du modèle avec trois recommandations pour Seattle.

    Reference :Anthropic Client SDK, DefaultAzureCredential

Utiliser l’authentification par clé API

Pour les points de terminaison de l’API Messages, utilisez votre URL de base et votre clé API pour vous authentifier auprès du service.

  1. Installer les dépendances : installez le Kit de développement logiciel (SDK) Anthropic à l’aide de pip (nécessite Python 3.8 ou version ultérieure) :

    pip install -U "anthropic"
    
  2. Exécutez un exemple de code de base pour effectuer les tâches suivantes :

    1. Créez un client avec le Kit de développement logiciel (SDK) Anthropic en transmettant votre clé API à la configuration du SDK. Cette méthode d’authentification vous permet d’interagir en toute transparence avec le service.
    2. Effectuez un appel de base à l’API Messages. L’appel est synchrone.
    from anthropic import AnthropicFoundry
    
    baseURL = "https://<resource-name>.services.ai.azure.com/anthropic" # Your base URL. Replace <resource-name> with your resource name
    deploymentName = "claude-sonnet-4-6" # Replace with your deployment name
    apiKey = "YOUR_API_KEY" # Replace YOUR_API_KEY with your API key
    
    # Create client with API key authentication
    client = AnthropicFoundry(
        api_key=apiKey,
        base_url=baseURL
    )
    
    # Send request
    message = client.messages.create(
        model=deploymentName,
        messages=[
            {"role": "user", "content": "What are 3 things to visit in Seattle?"}
        ],
        max_tokens=1048,
        temperature=1,
        thinking={"type":"adaptive"},
        output_config={"effort": "max"},
        stream=False
    )
    
    print(message.content)
    

    Sortie attendue : Réponse JSON contenant la complétion de texte du modèle avec trois recommandations pour Seattle.

    Reference :Anthropic Client SDK

Modèles Claude disponibles

Foundry prend en charge les modèles Claude Opus 4.6, Claude Opus 4.5, Claude Opus 4.1, Claude Sonnet 4.6, Claude Sonnet 4.5 et Claude Haiku 4.5 grâce au déploiement standard mondial. Ces modèles ont des fonctionnalités clés :

  • Pensée étendue : raisonnement amélioré pour les tâches complexes.
  • Entrée d’image et de texte : capacité avancée pour l’analyse des graphiques, des diagrammes techniques, des rapports et d’autres ressources visuelles.
  • Génération de code : génération de code avancée, analyse et débogage.

Pour plus d’informations sur les fonctionnalités du modèle, consultez les fonctionnalités des modèles Claude.

Claude Opus 4.6 (préversion)

Claude Opus 4.6 est la dernière version du modèle le plus intelligent d’Anthropic et le meilleur modèle mondial pour le codage, les agents d’entreprise et le travail professionnel. Avec une fenêtre de contexte de 1M tokens (bêta) et une sortie maximale de 128K , Opus 4.6 est idéal pour le code de production, les agents sophistiqués, les tâches de bureau, l’analyse financière, la cybersécurité et l’utilisation informatique.

Claude Opus 4.5 (préversion)

Claude Opus 4.5 est un leader du secteur dans le codage, les agents, l’utilisation de l’ordinateur et les flux de travail d’entreprise. Avec une fenêtre de contexte de 200K tokens et une sortie maximale de 64K, Opus 4.5 est idéal pour le code de production, les agents sophistiqués, les tâches de bureau, l'analyse financière, la cybersécurité et les tâches informatiques.

Claude Opus 4.1 (préversion)

Claude Opus 4.1 est un leader du secteur du codage. Il offre des performances soutenues sur des tâches de longue durée qui nécessitent des efforts ciblés et des milliers d’étapes, ce qui étend considérablement ce que les agents d’IA peuvent résoudre.

Claude Sonnet 4.6 (préversion)

Claude Sonnet 4.6 fournit des informations de frontière à grande échelle, conçues pour le codage, les agents et les flux de travail d’entreprise. Avec une fenêtre de contexte de 1M de jetons (bêta) et une sortie maximale de 128K, Sonnet 4.6 est idéal pour le codage, les agents logiciels, les tâches de bureau, l’analyse financière, la cybersécurité et l’utilisation informatique.

Claude Sonnet 4.5 (préversion)

Claude Sonnet 4.5 est un modèle hautement capable de créer des agents réels et de gérer des tâches complexes à long horizon. Il offre un équilibre fort de vitesse et de coût pour les cas d’usage à volume élevé. Sonnet 4.5 fournit également une précision avancée pour l’utilisation de l’ordinateur, ce qui permet aux développeurs de diriger Claude pour utiliser les ordinateurs comme les gens le font.

Claude Haiku 4.5 (préversion)

Claude Haiku 4.5 offre des performances proches des frontières pour un large éventail de cas d’usage. Il s’impose comme l’un des modèles de codage et d’agent les plus performants, offrant un équilibre optimal entre rapidité et coût pour alimenter des produits gratuits et des sous-agents à grande échelle.

Fonctionnalités et capacités avancées des modèles Claude

Claude dans Foundry Models prend en charge les fonctionnalités et capacités avancées. Les fonctionnalités de base améliorent les capacités fondamentales de Claude pour le traitement, l’analyse et la génération de contenu dans différents formats et cas d’usage. Les outils permettent à Claude d’interagir avec des systèmes externes, d’exécuter du code et d’effectuer des tâches automatisées via différentes interfaces d’outils.

Voici quelques-unes des fonctionnalités principales prises en charge par Foundry :

  • Fenêtre contextuelle volumineuse : Fenêtre contextuelle étendue qui traite des documents plus volumineux et des conversations plus longues.

  • Compétences de l’agent : Étendez les capacités de Claude avec des compétences.

  • Citations : Ancrer les réponses de Claude dans les documents sources.

  • Modification du contexte : Gérez automatiquement le contexte de conversation avec des stratégies configurables.

  • Pensée étendue : Fonctionnalités de raisonnement améliorées pour les tâches complexes disponibles avec tous les modèles Claude.

    Conseil / Astuce

    Le thinking paramètre prend en charge les types : enabled et disabled. Pour, Opus 4.6 et Sonnet 4.6, le paramètre prend également en charge le adaptive type, ce qui permet au modèle de décider s’il faut penser, en fonction de la complexité des requêtes et du niveau d’effort.

  • Effort: Capacité à contrôler le compromis qualité/coût pour les réponses.

    Conseil / Astuce

    Le effort paramètre prend en charge les niveaux d’effort : low, mediumet high. Pour Opus 4.6 et Sonnet 4.6, le paramètre prend également en charge max le niveau d’effort. Utilisez ce paramètre avec ou sans activer la pensée.

  • Prise en charge PDF : Traitez et analysez du texte et du contenu visuel des documents PDF.

  • Mise en cache de commande : Fournissez à Claude davantage de connaissances et d’exemples de résultats pour réduire les coûts et la latence.

Voici quelques-uns des outils pris en charge par Foundry :

  • Connecteur MCP : Connectez-vous aux serveurs MCP distants directement à partir de l’API Messages sans client MCP distinct.
  • Mémoire: Stockez et récupérez des informations dans les conversations. Créez des bases de connaissances au fil du temps, gérez le contexte du projet et apprenez-en davantage sur les interactions passées.
  • Extraction web : Récupérez du contenu complet à partir de pages web et de documents PDF spécifiés pour une analyse approfondie.

Pour obtenir la liste complète des fonctionnalités et outils pris en charge, consultez la vue d’ensemble des fonctionnalités de Claude.

Prise en charge de l’agent

Quotas et limites d’API

Important

Actuellement, seuls les abonnements Entreprise et MCA-E sont éligibles pour l’utilisation du modèle Claude dans Foundry.

Les modèles Claude dans Foundry ont les limites de débit suivantes, mesurées en jetons par minute (TPM) et demandes par minute (RPM) :

Modèle Type de déploiement RPM par défaut TPM par défaut Enterprise et MCA-E RPM TPM MCA-E et Entreprise
claude-opus-4-6 Standard global 0 0 2 000 2,000,000
claude-opus-4-5 Standard global 0 0 2 000 2,000,000
claude-opus-4-1 Standard global 0 0 2 000 2,000,000
claude-sonnet-4-6 Standard global 0 0 2 000 2,000,000
claude-sonnet-4-5 Standard global 0 0 4,000 2,000,000
claude-haiku-4-5 Standard global 0 0 4,000 4,000,000

Pour augmenter votre quota au-delà des limites par défaut, envoyez une demande via le formulaire de demande d’augmentation de quota.

Meilleures pratiques relatives à la limite de débit

Pour optimiser votre utilisation et éviter la limitation du débit :

  • Implémentez la logique de nouvelle tentative : gérez les réponses 429 avec une temporisation exponentielle.
  • Demandes par lots : combinez plusieurs requêtes lorsque cela est possible.
  • Surveiller l’utilisation : Suivez la consommation de vos jetons et les schémas de requêtes.
  • Utilisez les modèles appropriés : choisissez le modèle Claude approprié pour votre cas d’usage.

Considérations relatives à l’IA responsable

Lorsque vous utilisez des modèles Claude dans Foundry, tenez compte des pratiques d’IA responsables suivantes :

Meilleures pratiques

Suivez ces bonnes pratiques lors de l’utilisation des modèles Claude dans Foundry :

Sélection du modèle

Choisissez le modèle Claude approprié en fonction de vos besoins spécifiques :

  • Claude Opus 4.6 : modèle le plus intelligent pour la création d’agents, le codage et les flux de travail d’entreprise.
  • Claude Opus 4.5 : Meilleures performances dans le codage, les agents, l’utilisation de l’ordinateur et les flux de travail d’entreprise.
  • Claude Opus 4.1 : Raisonnement complexe et applications d’entreprise.
  • Claude Sonnet 4.6 : intelligence de pointe à grande échelle pour le code, les agents et la majorité des usages.
  • Claude Sonnet 4.5 : Performances et capacités équilibrées, flux de travail de production.
  • Claude Haiku 4.5 : Optimisation de la vitesse et des coûts, traitement en volume élevé.

Demander à l’ingénierie

  • Instructions claires : fournissez des instructions spécifiques et détaillées.
  • Gestion du contexte : utilisez efficacement la fenêtre de contexte disponible.
  • Définitions de rôle : utilisez les messages système pour définir le rôle et le comportement de l’Assistant.
  • Invites structurées : utilisez une mise en forme cohérente pour obtenir de meilleurs résultats.

Optimisation des coûts

  • Gestion des jetons : surveillez et optimisez l’utilisation des jetons.
  • Sélection du modèle : utilisez le modèle le plus rentable pour votre cas d’usage.
  • Mise en cache : implémentez la mise en cache d’invite explicite le cas échéant.
  • Traitement par lots de requêtes : combinez plusieurs requêtes lorsque cela est possible.

Résolution des problèmes

Le tableau suivant répertorie les erreurs courantes lorsque vous travaillez avec des modèles Claude dans Foundry et leurs solutions :

Erreur La cause Solution
401 Non autorisé Clé API non valide ou expirée, ou étendue incorrecte du jeton Entra ID. Vérifiez que votre clé API est correcte. Pour Entra ID, vérifiez que vous utilisez l’étendue https://cognitiveservices.azure.com/.default.
403 Interdit Autorisations insuffisantes sur la ressource ou l’abonnement. Vérifiez que vous disposez d’un rôle Contributeur ou Propriétaire sur le groupe de ressources. Pour Entra ID, vérifiez que le rôle d’utilisateur Cognitive Services est affecté.
404 Introuvable URL de point de terminaison incorrect ou nom de déploiement incorrect. Vérifiez que votre URL de base suit le modèle https://<resource-name>.services.ai.azure.com/anthropic et que le nom du déploiement correspond à votre configuration.
429 Trop de demandes Limite de débit dépassée pour votre niveau d’abonnement. Implémentez un repli exponentiel avec une logique de réessai. Envisagez de réduire la fréquence des demandes ou de demander une augmentation de quota.
Erreur d’éligibilité de l’abonnement Abonnement non Enterprise ou non MCA-E. Les modèles Claude nécessitent un abonnement Entreprise ou MCA-E. Pour plus d’informations, consultez les quotas d’API et les limites .
Région non disponible Un déploiement a été tenté dans une région non prise en charge. Déployez vers USA Est2 ou Suède Centre, les régions prises en charge pour les modèles Claude.