Partager via


Vue d’ensemble : déployer des modèles IA dans le portail Azure AI Foundry

Le catalogue de modèles du portail Azure AI Foundry est le hub qui permet de découvrir et d’utiliser un large éventail de modèles pour créer des applications d’IA générative. Vous devez déployer les modèles afin de les rendre disponibles pour recevoir les requêtes d’inférence. Azure AI Foundry offre une suite complète d’options de déploiement pour les modèles, en fonction de vos besoins et de vos besoins en matière de modèle.

Déployer des modèles

Les options de déploiement varient en fonction de l’offre de modèle :

  • Azure OpenAI dans les modèles Azure AI Foundry : Les derniers modèles OpenAI qui ont des fonctionnalités d’entreprise d’Azure avec des options de facturation flexibles.
  • Déploiement standard : Ces modèles ne nécessitent pas de quota de calcul à partir de votre abonnement et sont facturés par jeton dans une offre de paiement serverless par jeton.
  • Modèles ouverts et personnalisés : Le catalogue de modèles offre un accès à une grande variété de modèles entre les modalités, y compris les modèles d’accès ouvert. Vous pouvez héberger des modèles ouverts dans votre propre abonnement avec une infrastructure managée, des machines virtuelles et le nombre d’instances nécessaires pour la gestion de la capacité.

Azure AI Foundry propose quatre options de déploiement différentes :

Nom Azure OpenAI Modèles Azure AI Foundry Déploiement standard Capacité de calcul managée
Quels modèles peuvent être déployés ? Modèles Azure OpenAI Modèles Azure OpenAI et déploiement Standard Déploiement standard Modèles personnalisés et ouverts
Ressources de déploiement Ressource Azure OpenAI Ressource des services Azure AI Ressource de projet IA Ressource de projet IA
Nécessite hubs/projets Non Non Oui Oui
Options de traitement des données Régional
Zone de données
Mondial
Mondial Régional Régional
Réseau privé Oui Oui Oui Oui
Filtrage du contenu Oui Oui Oui Non
Filtrage de contenu personnalisé Oui Oui Non Non
Authentification sans clé Oui Oui Non Non
Idéal lorsque Vous envisagez d’utiliser uniquement des modèles OpenAI Vous envisagez de tirer parti des modèles phares dans le catalogue Azure AI, y compris OpenAI. Vous envisagez d’utiliser un modèle unique à partir d’un fournisseur spécifique (à l’exception d’OpenAI). Si vous prévoyez d’utiliser des modèles ouverts et que vous avez suffisamment de quota de calcul disponible dans votre abonnement.
Bases de facturation Utilisation des jetons et unités de débit approvisionnées Utilisation des jetons Utilisation de jeton1 Heures cœur de calcul2
Instructions de déploiement Déployer sur Azure OpenAI Déployer sur Foundry Models Déployer sur un déploiement standard Déployer vers le calcul managé

1 Une infrastructure de point de terminaison minimale est facturée par minute. Vous n’êtes pas facturé pour l’infrastructure qui héberge le modèle dans le déploiement standard. Une fois que vous avez supprimé le point de terminaison, aucun autre frais n’est facturé.

2 La facturation est effectuée sur la base des minutes, en fonction du niveau du produit et du nombre d’instances utilisées dans le déploiement depuis le moment de la création. Une fois que vous avez supprimé le point de terminaison, aucun autre frais n’est facturé.

Conseil / Astuce

Pour plus d’informations sur le suivi des coûts, consultez Surveiller les coûts pour les modèles proposés via la Place de marché Azure.

Que dois-je penser des options de déploiement ?

Azure AI Foundry vous encourage à explorer différentes options de déploiement et à choisir celle qui convient le mieux à vos besoins métier et techniques. En général, envisagez d’utiliser l’approche suivante pour sélectionner une option de déploiement :

  • Commencez par les modèles Foundry, qui est l’option avec la plus grande étendue. Cette option vous permet d’itérer et de prototyper plus rapidement dans votre application sans avoir à reconstruire votre architecture chaque fois que vous décidez de modifier quelque chose. Si vous utilisez des hubs ou des projets Azure AI Foundry, activez cette option en activant la fonctionnalité Modèles Foundry.

  • Lorsque vous envisagez d’utiliser un modèle spécifique :

    • Si vous êtes intéressé par les modèles Azure OpenAI, utilisez Azure OpenAI dans Les modèles Foundry. Cette option est conçue pour les modèles Azure OpenAI et offre un large éventail de fonctionnalités.

    • Si vous êtes intéressé par un modèle particulier à partir d’une offre de paiement serverless par jeton et que vous ne prévoyez pas d’utiliser d’autres types de modèle, utilisez le déploiement Standard. Les déploiements standard permettent le déploiement d’un modèle unique sous un ensemble unique d’URL et de clés de point de terminaison.

  • Lorsque votre modèle n’est pas disponible dans le déploiement standard et que vous disposez d’un quota de calcul disponible dans votre abonnement, utilisez Managed Compute, qui prend en charge le déploiement de modèles ouverts et personnalisés. Il permet également un niveau élevé de personnalisation du serveur d’inférence de déploiement, des protocoles et de la configuration détaillée.