Vue d’ensemble : déployer des modèles IA dans le portail Azure AI Foundry

2025-05-20

Le catalogue de modèles du portail Azure AI Foundry est le hub qui permet de découvrir et d’utiliser un large éventail de modèles pour créer des applications d’IA générative. Vous devez déployer les modèles afin de les rendre disponibles pour recevoir les requêtes d’inférence. Azure AI Foundry offre une suite complète d’options de déploiement pour les modèles, en fonction de vos besoins et de vos besoins en matière de modèle.

Déployer des modèles

Les options de déploiement varient en fonction de l’offre de modèle :

Azure OpenAI dans les modèles Azure AI Foundry : Les derniers modèles OpenAI qui ont des fonctionnalités d’entreprise d’Azure avec des options de facturation flexibles.
Déploiement standard : Ces modèles ne nécessitent pas de quota de calcul à partir de votre abonnement et sont facturés par jeton dans une offre de paiement serverless par jeton.
Modèles ouverts et personnalisés : Le catalogue de modèles offre un accès à une grande variété de modèles entre les modalités, y compris les modèles d’accès ouvert. Vous pouvez héberger des modèles ouverts dans votre propre abonnement avec une infrastructure managée, des machines virtuelles et le nombre d’instances nécessaires pour la gestion de la capacité.

Azure AI Foundry propose quatre options de déploiement différentes :

Nom	Azure OpenAI	Modèles Azure AI Foundry	Déploiement standard	Capacité de calcul managée
Quels modèles peuvent être déployés ?	Modèles Azure OpenAI	Modèles Azure OpenAI et déploiement Standard	Déploiement standard	Modèles personnalisés et ouverts
Ressources de déploiement	Ressource Azure OpenAI	Ressource des services Azure AI	Ressource de projet IA	Ressource de projet IA
Nécessite hubs/projets	Non	Non	Oui	Oui
Options de traitement des données	Régional Zone de données Mondial	Mondial	Régional	Régional
Réseau privé	Oui	Oui	Oui	Oui
Filtrage du contenu	Oui	Oui	Oui	Non
Filtrage de contenu personnalisé	Oui	Oui	Non	Non
Authentification sans clé	Oui	Oui	Non	Non
Idéal lorsque	Vous envisagez d’utiliser uniquement des modèles OpenAI	Vous envisagez de tirer parti des modèles phares dans le catalogue Azure AI, y compris OpenAI.	Vous envisagez d’utiliser un modèle unique à partir d’un fournisseur spécifique (à l’exception d’OpenAI).	Si vous prévoyez d’utiliser des modèles ouverts et que vous avez suffisamment de quota de calcul disponible dans votre abonnement.
Bases de facturation	Utilisation des jetons et unités de débit approvisionnées	Utilisation des jetons	Utilisation de jeton¹	Heures cœur de calcul²
Instructions de déploiement	Déployer sur Azure OpenAI	Déployer sur Foundry Models	Déployer sur un déploiement standard	Déployer vers le calcul managé

¹ Une infrastructure de point de terminaison minimale est facturée par minute. Vous n’êtes pas facturé pour l’infrastructure qui héberge le modèle dans le déploiement standard. Une fois que vous avez supprimé le point de terminaison, aucun autre frais n’est facturé.

² La facturation est effectuée sur la base des minutes, en fonction du niveau du produit et du nombre d’instances utilisées dans le déploiement depuis le moment de la création. Une fois que vous avez supprimé le point de terminaison, aucun autre frais n’est facturé.

Conseil / Astuce

Pour plus d’informations sur le suivi des coûts, consultez Surveiller les coûts pour les modèles proposés via la Place de marché Azure.

Que dois-je penser des options de déploiement ?

Azure AI Foundry vous encourage à explorer différentes options de déploiement et à choisir celle qui convient le mieux à vos besoins métier et techniques. En général, envisagez d’utiliser l’approche suivante pour sélectionner une option de déploiement :

Commencez par les modèles Foundry, qui est l’option avec la plus grande étendue. Cette option vous permet d’itérer et de prototyper plus rapidement dans votre application sans avoir à reconstruire votre architecture chaque fois que vous décidez de modifier quelque chose. Si vous utilisez des hubs ou des projets Azure AI Foundry, activez cette option en activant la fonctionnalité Modèles Foundry.
Lorsque vous envisagez d’utiliser un modèle spécifique :
- Si vous êtes intéressé par les modèles Azure OpenAI, utilisez Azure OpenAI dans Les modèles Foundry. Cette option est conçue pour les modèles Azure OpenAI et offre un large éventail de fonctionnalités.
- Si vous êtes intéressé par un modèle particulier à partir d’une offre de paiement serverless par jeton et que vous ne prévoyez pas d’utiliser d’autres types de modèle, utilisez le déploiement Standard. Les déploiements standard permettent le déploiement d’un modèle unique sous un ensemble unique d’URL et de clés de point de terminaison.
Lorsque votre modèle n’est pas disponible dans le déploiement standard et que vous disposez d’un quota de calcul disponible dans votre abonnement, utilisez Managed Compute, qui prend en charge le déploiement de modèles ouverts et personnalisés. Il permet également un niveau élevé de personnalisation du serveur d’inférence de déploiement, des protocoles et de la configuration détaillée.

Partager via

Vue d’ensemble : déployer des modèles IA dans le portail Azure AI Foundry

Déployer des modèles

Que dois-je penser des options de déploiement ?

Contenu connexe

Commentaires

Ressources supplémentaires