Notes
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Le catalogue de modèles du portail Azure AI Foundry est le hub qui permet de découvrir et d’utiliser un large éventail de modèles pour créer des applications d’IA générative. Vous devez déployer les modèles afin de les rendre disponibles pour recevoir les requêtes d’inférence. Azure AI Foundry offre une suite complète d’options de déploiement pour les modèles, en fonction de vos besoins et de vos besoins en matière de modèle.
Déployer des modèles
Les options de déploiement varient en fonction de l’offre de modèle :
- Azure OpenAI dans les modèles Azure AI Foundry : Les derniers modèles OpenAI qui ont des fonctionnalités d’entreprise d’Azure avec des options de facturation flexibles.
- Déploiement standard : Ces modèles ne nécessitent pas de quota de calcul à partir de votre abonnement et sont facturés par jeton dans une offre de paiement serverless par jeton.
- Modèles ouverts et personnalisés : Le catalogue de modèles offre un accès à une grande variété de modèles entre les modalités, y compris les modèles d’accès ouvert. Vous pouvez héberger des modèles ouverts dans votre propre abonnement avec une infrastructure managée, des machines virtuelles et le nombre d’instances nécessaires pour la gestion de la capacité.
Azure AI Foundry propose quatre options de déploiement différentes :
Nom | Azure OpenAI | Modèles Azure AI Foundry | Déploiement standard | Capacité de calcul managée |
---|---|---|---|---|
Quels modèles peuvent être déployés ? | Modèles Azure OpenAI | Modèles Azure OpenAI et déploiement Standard | Déploiement standard | Modèles personnalisés et ouverts |
Ressources de déploiement | Ressource Azure OpenAI | Ressource des services Azure AI | Ressource de projet IA | Ressource de projet IA |
Nécessite hubs/projets | Non | Non | Oui | Oui |
Options de traitement des données | Régional Zone de données Mondial |
Mondial | Régional | Régional |
Réseau privé | Oui | Oui | Oui | Oui |
Filtrage du contenu | Oui | Oui | Oui | Non |
Filtrage de contenu personnalisé | Oui | Oui | Non | Non |
Authentification sans clé | Oui | Oui | Non | Non |
Idéal lorsque | Vous envisagez d’utiliser uniquement des modèles OpenAI | Vous envisagez de tirer parti des modèles phares dans le catalogue Azure AI, y compris OpenAI. | Vous envisagez d’utiliser un modèle unique à partir d’un fournisseur spécifique (à l’exception d’OpenAI). | Si vous prévoyez d’utiliser des modèles ouverts et que vous avez suffisamment de quota de calcul disponible dans votre abonnement. |
Bases de facturation | Utilisation des jetons et unités de débit approvisionnées | Utilisation des jetons | Utilisation de jeton1 | Heures cœur de calcul2 |
Instructions de déploiement | Déployer sur Azure OpenAI | Déployer sur Foundry Models | Déployer sur un déploiement standard | Déployer vers le calcul managé |
1 Une infrastructure de point de terminaison minimale est facturée par minute. Vous n’êtes pas facturé pour l’infrastructure qui héberge le modèle dans le déploiement standard. Une fois que vous avez supprimé le point de terminaison, aucun autre frais n’est facturé.
2 La facturation est effectuée sur la base des minutes, en fonction du niveau du produit et du nombre d’instances utilisées dans le déploiement depuis le moment de la création. Une fois que vous avez supprimé le point de terminaison, aucun autre frais n’est facturé.
Conseil / Astuce
Pour plus d’informations sur le suivi des coûts, consultez Surveiller les coûts pour les modèles proposés via la Place de marché Azure.
Que dois-je penser des options de déploiement ?
Azure AI Foundry vous encourage à explorer différentes options de déploiement et à choisir celle qui convient le mieux à vos besoins métier et techniques. En général, envisagez d’utiliser l’approche suivante pour sélectionner une option de déploiement :
Commencez par les modèles Foundry, qui est l’option avec la plus grande étendue. Cette option vous permet d’itérer et de prototyper plus rapidement dans votre application sans avoir à reconstruire votre architecture chaque fois que vous décidez de modifier quelque chose. Si vous utilisez des hubs ou des projets Azure AI Foundry, activez cette option en activant la fonctionnalité Modèles Foundry.
Lorsque vous envisagez d’utiliser un modèle spécifique :
Si vous êtes intéressé par les modèles Azure OpenAI, utilisez Azure OpenAI dans Les modèles Foundry. Cette option est conçue pour les modèles Azure OpenAI et offre un large éventail de fonctionnalités.
Si vous êtes intéressé par un modèle particulier à partir d’une offre de paiement serverless par jeton et que vous ne prévoyez pas d’utiliser d’autres types de modèle, utilisez le déploiement Standard. Les déploiements standard permettent le déploiement d’un modèle unique sous un ensemble unique d’URL et de clés de point de terminaison.
Lorsque votre modèle n’est pas disponible dans le déploiement standard et que vous disposez d’un quota de calcul disponible dans votre abonnement, utilisez Managed Compute, qui prend en charge le déploiement de modèles ouverts et personnalisés. Il permet également un niveau élevé de personnalisation du serveur d’inférence de déploiement, des protocoles et de la configuration détaillée.