Déployer des modèles en tant que déploiements d’API serverless (classique)

Vous pouvez utiliser n’importe quel navigateur web compatible pour naviguer dans Foundry.

Rechercher votre modèle dans le catalogue de modèles

Connectez-vous à Microsoft Foundry. Assurez-vous que l'interrupteur New Foundry est désactivé. Ces étapes font référence à Foundry (classique).
Si vous n’êtes pas déjà dans votre projet, sélectionnez-le.
Sélectionnez Catalogue de modèles dans le volet gauche.

Models vendus directement par Azure
Modèles des partenaires et de la communauté

Sélectionnez la carte de modèle du modèle que vous souhaitez déployer. Dans cet article, vous sélectionnez un modèle DeepSeek-R1 .
Sélectionnez Utiliser ce modèle pour ouvrir la fenêtre de déploiement de l’API serverless dans laquelle vous pouvez afficher l’onglet Tarification et termes .
Dans l’Assistant Déploiement, nommez le déploiement. L’option Filtre de contenu (préversion) est activée par défaut. Conservez le paramètre par défaut pour le service afin de détecter des contenus dangereux tels que la haine, l’automutilation, le contenu sexuel et la violence. Pour plus d’informations sur le filtrage de contenu, consultez Filtrage de contenu dans le portail Foundry.

Déployer le modèle sur une API serverless

Dans cette section, vous allez créer un point de terminaison pour votre modèle.

Dans l’Assistant Déploiement, sélectionnez Déployer. Une fois que le déploiement est prêt, vous êtes redirigé vers la page Déploiements.
Pour afficher les points de terminaison déployés sur votre projet, dans la section Mes ressources du volet gauche, sélectionnez Modèles + points de terminaison.
Le point de terminaison créé utilise une authentification par clé pour l’autorisation. Pour obtenir les clés associées à un point de terminaison donné, procédez comme suit :
1. Sélectionnez le déploiement, puis notez l’URI cible et la clé du point de terminaison.
2. Utilisez ces informations d’identification pour appeler le déploiement et générer des prédictions.
Si vous devez utiliser ce déploiement à partir d’un autre projet ou hub, ou si vous envisagez d’utiliser Prompt Flow pour développer des applications intelligentes, il est nécessaire d’établir une connexion au déploiement de l’API serverless. Pour savoir comment configurer un déploiement d’API serverless existant sur un nouveau projet ou hub, consultez Utiliser le déploiement d’API serverless à partir d’un autre projet ou de Prompt flow.

Conseil / Astuce

Si vous utilisez Prompt flow dans le même projet ou hub où le déploiement a été réalisé, il est néanmoins nécessaire de créer la connexion.

Utiliser le déploiements d’API serverless

Les modèles déployés dans Azure Machine Learning et Foundry dans les déploiements d’API serverless prennent en charge les Azure API d’inférence de modèle IA qui expose un ensemble commun de fonctionnalités pour les modèles fondamentaux et qui peuvent être utilisés par les développeurs pour consommer des prédictions à partir d’un ensemble diversifié de modèles de manière uniforme et cohérente.

En savoir plus sur les fonctionnalités de cette API et découvrir comment vous pouvez l’utiliser lors de la création d’applications.

Supprimez les points de terminaison et les abonnements

Conseil / Astuce

Étant donné que vous pouvez personnaliser le volet gauche dans le portail Microsoft Foundry, vous pouvez voir différents éléments que ceux indiqués dans ces étapes. Si vous ne voyez pas ce que vous recherchez, sélectionnez ... Plus en bas du volet gauche.

Vous pouvez supprimer les abonnements et les points de terminaison de modèle. La suppression d’un abonnement à un modèle rend tout point de terminaison associé non sain et inutilisable.

Pour supprimer un déploiement d’API serverless :

Accédez à la Fonderie.
Accédez à votre projet.
Dans la section Mes ressources , sélectionnez Modèles + points de terminaison.
Ouvrez le déploiement à supprimer.
Sélectionnez Supprimer.

Pour supprimer l’abonnement au modèle associé :

Accédez au portail Azure
Accédez au groupe de ressources auquel appartient le projet.
Dans le filtre Type, sélectionnez SaaS.
Sélectionnez l’abonnement à supprimer.
Sélectionnez Supprimer.

Pour utiliser Foundry, installez la Azure CLI et l’extension ml pour Azure Machine Learning.
```
az extension add -n ml
```
Si l’extension est déjà installée, vérifiez que la version installée est la plus récente.
```
az extension update -n ml
```
Une fois l’extension installée, configurez-la :
```
az account set --subscription <subscription>
az configure --defaults workspace=<project-name> group=<resource-group> location=<location>
```

Rechercher votre modèle dans le catalogue de modèles

Connectez-vous à Microsoft Foundry. Assurez-vous que l'interrupteur New Foundry est désactivé. Ces étapes font référence à Foundry (classique).
Si vous n’êtes pas déjà dans votre projet, sélectionnez-le.
Sélectionnez Catalogue de modèles dans le volet gauche.

Models vendus directement par Azure
Modèles des partenaires et de la communauté

Sélectionnez la carte de modèle du modèle que vous souhaitez déployer. Dans cet article, vous sélectionnez un modèle DeepSeek-R1 .
Copiez l’ID de modèle sans inclure la version du modèle, car les déploiements d’API serverless déploient toujours la dernière version du modèle disponible. Par exemple, pour l’ID de modèle azureml://registries/azureml-deepseek/models/DeepSeek-R1/versions/1, copiez azureml://registries/azureml-deepseek/models/DeepSeek-R1.

capture d'écran

Sélectionnez la carte de modèle du modèle que vous souhaitez déployer. Dans cet article, vous sélectionnez Cohere-command-r-08-2024.

Note

Modèles des partenaires et de la communauté sont proposés via Azure Marketplace. Pour ces modèles, vérifiez que votre compte dispose des autorisations de rôle Azure AI Developer sur le groupe de ressources, ou que vous disposez des autorisations requises pour vous abonner aux offres de modèles, car vous devez abonner votre projet à l'offre de modèle particulière.
Copiez l’ID de modèle sans inclure la version du modèle, car les déploiements d’API serverless déploient toujours la dernière version du modèle disponible. Par exemple, pour l’ID de modèle azureml://registries/azureml-cohere/models/Cohere-command-r-08-2024/versions/1, copiez azureml://registries/azureml-cohere/models/Cohere-command-r-08-2024.

Pour les modèles des partenaires et de la communauté, par exemple , Cohere-command-r-08-2024, vous devez créer un abonnement avant de pouvoir les déployer. S'il s'agit de la première fois que vous déployez le modèle dans le projet, vous devez vous abonner à votre projet pour l'offre de modèle spécifique à partir de Azure Marketplace. Chaque projet a son propre abonnement à l’offre de Azure Marketplace particulière du modèle, ce qui vous permet de contrôler et de surveiller les dépenses. Une fois que vous abonnez un projet pour l'offre de Azure Marketplace particulière, les déploiements suivants de la même offre dans le même projet ne nécessitent pas de s'abonner à nouveau.

En outre, les modèles proposés via Azure Marketplace sont disponibles pour le déploiement vers le déploiement d’API serverless dans des régions spécifiques. Consultez les régions prises en charge pour le déploiement sans serveur afin de vérifier les régions disponibles pour le modèle particulier. Si la région dans laquelle se trouve votre projet n’est pas répertoriée, vous pouvez déployer sur un projet dans une région prise en charge, puis consommer le déploiement d’API serverless à partir d’un autre projet.

Créer l'abonnement du modèle à la place de marché. Lorsque vous créez un abonnement, vous acceptez les conditions générales associées à l’offre de modèle.

subscription.yml
```
name: Cohere-command-r-08-2024-qwerty
model_id: azureml://registries/azureml-cohere/models/Cohere-command-r-08-2024
```
Utilisez le fichier précédent pour créer l’abonnement :
```
az ml marketplace-subscription create -f subscription.yml
```
(Facultatif) À tout moment, vous pouvez voir les offres de modèle auxquelles votre projet est actuellement abonné :
```
az ml marketplace-subscription list
```

Les étapes décrites dans cette section de l’article utilisent le modèle DeepSeek-R1 pour l’illustration. Les étapes sont les mêmes, que vous utilisiez des modèles Foundry vendus directement par Azure ou des modèles Foundry de partenaires et de la communauté. Par exemple, si vous choisissez de déployer le modèle Cohere-command-r-08-2024 à la place, vous pouvez remplacer les informations d’identification du modèle dans les extraits de code par les informations d’identification de Cohere.

Déployer le modèle sur une API serverless

Dans cette section, vous allez créer un point de terminaison pour votre modèle. Nommez le point de terminaison DeepSeek-R1-qwerty.

Créez le point de terminaison serverless.

endpoint.yml

name: DeepSeek-R1-qwerty
model_id: azureml://registries/azureml-deepseek/models/DeepSeek-R1

Utilisez le fichier endpoint.yml pour créer le point de terminaison :

az ml serverless-endpoint create -f endpoint.yml

À tout moment, vous pouvez voir les points de terminaison associés à votre projet :
```
az ml serverless-endpoint list
```
Le point de terminaison créé utilise une authentification par clé pour l’autorisation. Procédez comme suit pour obtenir les clés associées à un point de terminaison donné.
```
az ml serverless-endpoint get-credentials -n DeepSeek-R1-qwerty
```
Si vous devez utiliser ce déploiement à partir d’un autre projet ou hub, ou si vous envisagez d’utiliser Prompt Flow pour développer des applications intelligentes, il est nécessaire d’établir une connexion au déploiement de l’API serverless. Pour savoir comment configurer un déploiement d’API serverless existant sur un nouveau projet ou hub, consultez Utiliser le déploiement d’API serverless à partir d’un autre projet ou de Prompt flow.

Conseil / Astuce

Si vous utilisez Prompt flow dans le même projet ou hub où le déploiement a été réalisé, il est néanmoins nécessaire de créer la connexion.

Utiliser le déploiements d’API serverless

Les modèles déployés dans Azure Machine Learning et Foundry dans les déploiements d’API serverless prennent en charge les Azure API d’inférence de modèle IA qui expose un ensemble commun de fonctionnalités pour les modèles fondamentaux et qui peuvent être utilisés par les développeurs pour consommer des prédictions à partir d’un ensemble diversifié de modèles de manière uniforme et cohérente.

En savoir plus sur les fonctionnalités de cette API et découvrir comment vous pouvez l’utiliser lors de la création d’applications.

Supprimez les points de terminaison et les abonnements

Vous pouvez supprimer les abonnements et les points de terminaison de modèle. La suppression d’un abonnement à un modèle rend tout point de terminaison associé non sain et inutilisable.

Pour supprimer un déploiement d’API serverless :

az ml serverless-endpoint delete \
    --name "DeepSeek-R1-qwerty"

Pour supprimer l’abonnement au modèle associé :

az ml marketplace-subscription delete \
    --name "DeepSeek-R1"

Pour utiliser Foundry, installez le Kit de développement logiciel (SDK) Azure Machine Learning pour Python.

pip install -U azure-ai-ml

Après installation, importez les espaces de noms nécessaires et créez un client connecté à votre projet :

from azure.ai.ml import MLClient
from azure.identity import InteractiveBrowserCredential
from azure.ai.ml.entities import MarketplaceSubscription, ServerlessEndpoint

client = MLClient(
    credential=InteractiveBrowserCredential(tenant_id="<tenant-id>"),
    subscription_id="<subscription-id>",
    resource_group_name="<resource-group>",
    workspace_name="<project-name>",
)

Rechercher votre modèle dans le catalogue de modèles

Connectez-vous à Microsoft Foundry. Assurez-vous que l'interrupteur New Foundry est désactivé. Ces étapes font référence à Foundry (classique).
Si vous n’êtes pas déjà dans votre projet, sélectionnez-le.
Sélectionnez Catalogue de modèles dans le volet gauche.

Models vendus directement par Azure
Modèles des partenaires et de la communauté

Sélectionnez la carte de modèle du modèle que vous souhaitez déployer. Dans cet article, vous sélectionnez un modèle DeepSeek-R1 .
Copiez l’ID de modèle sans inclure la version du modèle, car les déploiements d’API serverless déploient toujours la dernière version du modèle disponible. Par exemple, pour l’ID de modèle azureml://registries/azureml-deepseek/models/DeepSeek-R1/versions/1, copiez azureml://registries/azureml-deepseek/models/DeepSeek-R1.

capture d'écran

Sélectionnez la carte de modèle du modèle que vous souhaitez déployer. Dans cet article, vous sélectionnez Cohere-command-r-08-2024.

Note

Modèles des partenaires et de la communauté sont proposés via Azure Marketplace. Pour ces modèles, vérifiez que votre compte dispose des autorisations de rôle Azure AI Developer sur le groupe de ressources, ou que vous disposez des autorisations requises pour vous abonner aux offres de modèles, car vous devez abonner votre projet à l'offre de modèle particulière.
Copiez l’ID de modèle sans inclure la version du modèle, car les déploiements d’API serverless déploient toujours la dernière version du modèle disponible. Par exemple, pour l’ID de modèle azureml://registries/azureml-cohere/models/Cohere-command-r-08-2024/versions/1, copiez azureml://registries/azureml-cohere/models/Cohere-command-r-08-2024.

Pour les modèles des partenaires et de la communauté, par exemple , Cohere-command-r-08-2024, vous devez créer un abonnement avant de pouvoir les déployer. S'il s'agit de la première fois que vous déployez le modèle dans le projet, vous devez vous abonner à votre projet pour l'offre de modèle spécifique à partir de Azure Marketplace. Chaque projet a son propre abonnement à l’offre de Azure Marketplace particulière du modèle, ce qui vous permet de contrôler et de surveiller les dépenses. Une fois que vous abonnez un projet pour l'offre de Azure Marketplace particulière, les déploiements suivants de la même offre dans le même projet ne nécessitent pas de s'abonner à nouveau.

En outre, les modèles proposés via Azure Marketplace sont disponibles pour le déploiement vers le déploiement d’API serverless dans des régions spécifiques. Consultez les régions prises en charge pour le déploiement sans serveur afin de vérifier les régions disponibles pour le modèle particulier. Si la région dans laquelle se trouve votre projet n’est pas répertoriée, vous pouvez déployer sur un projet dans une région prise en charge, puis consommer le déploiement d’API serverless à partir d’un autre projet.

Créer l'abonnement du modèle à la place de marché. Lorsque vous créez un abonnement, vous acceptez les conditions générales associées à l’offre de modèle.

model_id="azureml://registries/azureml-cohere/models/Cohere-command-r-08-2024"
subscription_name="Cohere-command-r-08-2024"

marketplace_subscription = MarketplaceSubscription(
    model_id=model_id,
    name=subscription_name,
)

marketplace_subscription = client.marketplace_subscriptions.begin_create_or_update(
    marketplace_subscription
).result()

(Facultatif) À tout moment, vous pouvez voir les offres de modèle auxquelles votre projet est actuellement abonné :

marketplace_sub_list = client.marketplace_subscriptions.list()

for sub in marketplace_sub_list:
    print(sub.as_dict())

Les étapes décrites dans cette section de l’article utilisent le modèle DeepSeek-R1 pour l’illustration. Les étapes sont les mêmes, que vous utilisiez des modèles Foundry vendus directement par Azure ou des modèles Foundry de partenaires et de la communauté. Par exemple, si vous choisissez de déployer le modèle Cohere-command-r-08-2024 à la place, vous pouvez remplacer les informations d’identification du modèle dans les extraits de code par les informations d’identification de Cohere.

Déployer le modèle sur une API serverless

Dans cette section, vous allez créer un point de terminaison pour votre modèle. Nommez le point de terminaison DeepSeek-R1-qwerty.

Créez le point de terminaison serverless.

endpoint_name="DeepSeek-R1-qwerty"

serverless_endpoint = ServerlessEndpoint(
    name=endpoint_name,
    model_id=model_id
)

created_endpoint = client.serverless_endpoints.begin_create_or_update(
    serverless_endpoint
).result()

À tout moment, vous pouvez voir les points de terminaison associés à votre projet :

endpoint_name="DeepSeek-R1-qwerty"

serverless_endpoint = ServerlessEndpoint(
    name=endpoint_name,
    model_id=model_id
)

created_endpoint = client.serverless_endpoints.begin_create_or_update(
    serverless_endpoint
).result()

Le point de terminaison créé utilise une authentification par clé pour l’autorisation. Procédez comme suit pour obtenir les clés associées à un point de terminaison donné.
```
endpoint_keys = client.serverless_endpoints.get_keys(endpoint_name)
print(endpoint_keys.primary_key)
print(endpoint_keys.secondary_key)
```
Si vous devez utiliser ce déploiement à partir d’un autre projet ou hub, ou si vous envisagez d’utiliser Prompt Flow pour développer des applications intelligentes, il est nécessaire d’établir une connexion au déploiement de l’API serverless. Pour savoir comment configurer un déploiement d’API serverless existant sur un nouveau projet ou hub, consultez Utiliser le déploiement d’API serverless à partir d’un autre projet ou de Prompt flow.

Conseil / Astuce

Si vous utilisez Prompt flow dans le même projet ou hub où le déploiement a été réalisé, il est néanmoins nécessaire de créer la connexion.

Utiliser le déploiements d’API serverless

Les modèles déployés dans Azure Machine Learning et Foundry dans les déploiements d’API serverless prennent en charge les Azure API d’inférence de modèle IA qui expose un ensemble commun de fonctionnalités pour les modèles fondamentaux et qui peuvent être utilisés par les développeurs pour consommer des prédictions à partir d’un ensemble diversifié de modèles de manière uniforme et cohérente.

En savoir plus sur les fonctionnalités de cette API et découvrir comment vous pouvez l’utiliser lors de la création d’applications.

Supprimez les points de terminaison et les abonnements

Vous pouvez supprimer les abonnements et les points de terminaison de modèle. La suppression d’un abonnement à un modèle rend tout point de terminaison associé non sain et inutilisable.

client.serverless_endpoints.begin_delete(endpoint_name).wait()

Pour supprimer l’abonnement au modèle associé :

client.marketplace_subscriptions.begin_delete(subscription_name).wait()

Pour utiliser Foundry, installez le Azure CLI comme décrit dans Azure CLI.

Configurez les variables d’environnement suivantes en fonction de vos paramètres :
```
RESOURCE_GROUP="serverless-models-dev"
LOCATION="eastus2" 
```

Rechercher votre modèle dans le catalogue de modèles

Connectez-vous à Microsoft Foundry. Assurez-vous que l'interrupteur New Foundry est désactivé. Ces étapes font référence à Foundry (classique).
Si vous n’êtes pas déjà dans votre projet, sélectionnez-le.
Sélectionnez Catalogue de modèles dans le volet gauche.

Models vendus directement par Azure
Modèles des partenaires et de la communauté

Sélectionnez la carte de modèle du modèle que vous souhaitez déployer. Dans cet article, vous sélectionnez un modèle DeepSeek-R1 .
Copiez l’ID de modèle sans inclure la version du modèle, car les déploiements d’API serverless déploient toujours la dernière version du modèle disponible. Par exemple, pour l’ID de modèle azureml://registries/azureml-deepseek/models/DeepSeek-R1/versions/1, copiez azureml://registries/azureml-deepseek/models/DeepSeek-R1.

capture d'écran

Sélectionnez la carte de modèle du modèle que vous souhaitez déployer. Dans cet article, vous sélectionnez Cohere-command-r-08-2024.

Note

Modèles des partenaires et de la communauté sont proposés via Azure Marketplace. Pour ces modèles, vérifiez que votre compte dispose des autorisations de rôle Azure AI Developer sur le groupe de ressources, ou que vous disposez des autorisations requises pour vous abonner aux offres de modèles, car vous devez abonner votre projet à l'offre de modèle particulière.
Copiez l’ID de modèle sans inclure la version du modèle, car les déploiements d’API serverless déploient toujours la dernière version du modèle disponible. Par exemple, pour l’ID de modèle azureml://registries/azureml-cohere/models/Cohere-command-r-08-2024/versions/1, copiez azureml://registries/azureml-cohere/models/Cohere-command-r-08-2024.

Pour les modèles des partenaires et de la communauté, par exemple , Cohere-command-r-08-2024, vous devez créer un abonnement avant de pouvoir les déployer. S'il s'agit de la première fois que vous déployez le modèle dans le projet, vous devez vous abonner à votre projet pour l'offre de modèle spécifique à partir de Azure Marketplace. Chaque projet a son propre abonnement à l’offre de Azure Marketplace particulière du modèle, ce qui vous permet de contrôler et de surveiller les dépenses. Une fois que vous abonnez un projet pour l'offre de Azure Marketplace particulière, les déploiements suivants de la même offre dans le même projet ne nécessitent pas de s'abonner à nouveau.

En outre, les modèles proposés via Azure Marketplace sont disponibles pour le déploiement vers le déploiement d’API serverless dans des régions spécifiques. Consultez les régions prises en charge pour le déploiement sans serveur afin de vérifier les régions disponibles pour le modèle particulier. Si la région dans laquelle se trouve votre projet n’est pas répertoriée, vous pouvez déployer sur un projet dans une région prise en charge, puis consommer le déploiement d’API serverless à partir d’un autre projet.

Utilisez la configuration bicep suivante pour créer un abonnement à un modèle. Lorsque vous créez un abonnement, vous acceptez les conditions générales associées à l’offre de modèle.

model-subscription.bicep

param projectName string = 'my-project'
param modelId string = 'azureml://registries/azureml-cohere/models/Cohere-command-r-08-2024'

var modelName = substring(modelId, (lastIndexOf(modelId, '/') + 1))
// Replace period character which is used in some model names (and is not valid in the subscription name)
var sanitizedModelName = replace(modelName, '.', '')
var subscriptionName = '${sanitizedModelName}-subscription'

resource projectName_subscription 'Microsoft.MachineLearningServices/workspaces/marketplaceSubscriptions@2024-04-01-preview' = if (!startsWith(
  modelId,
  'azureml://registries/azureml/'
)) {
  name: '${projectName}/${subscriptionName}'
  properties: {
    modelId: modelId
  }
}

Créez ensuite la ressource comme suit :

az deployment group create --resource-group $RESOURCE_GROUP --template-file model-subscription.bicep

(Facultatif) À tout moment, vous pouvez voir les offres de modèle auxquelles votre projet est actuellement abonné. Vous pouvez utiliser les outils de gestion des ressources pour interroger les ressources. Le code suivant utilise Azure CLI :
```
az resource list \
    --query "[?type=='Microsoft.SaaS']"
```

Les étapes décrites dans cette section de l’article utilisent le modèle DeepSeek-R1 pour l’illustration. Les étapes sont les mêmes, que vous utilisiez des modèles Foundry vendus directement par Azure ou des modèles Foundry de partenaires et de la communauté. Par exemple, si vous choisissez de déployer le modèle Cohere-command-r-08-2024 à la place, vous pouvez remplacer les informations d’identification du modèle dans les extraits de code par les informations d’identification de Cohere.

Déployer le modèle sur une API serverless

Dans cette section, vous allez créer un point de terminaison pour votre modèle. Nommez le point de terminaison myserverless-text-1234ss.

Créez le point de terminaison serverless. Utilisez le modèle suivant pour créer un point de terminaison :

serverless-endpoint.bicep

param projectName string = 'my-project'
param endpointName string = 'myserverless-text-1234ss'
param location string = resourceGroup().location
param modelId string = 'azureml://registries/azureml-deepseek/models/DeepSeek-R1'

var modelName = substring(modelId, (lastIndexOf(modelId, '/') + 1))
// Replace period character which is used in some model names (and is not valid in the subscription name)
var sanitizedModelName = replace(modelName, '.', '')
var subscriptionName = '${sanitizedModelName}-subscription'

resource projectName_endpoint 'Microsoft.MachineLearningServices/workspaces/serverlessEndpoints@2024-04-01-preview' = {
  name: '${projectName}/${endpointName}'
  location: location
  sku: {
    name: 'Consumption'
  }
  properties: {
    modelSettings: {
      modelId: modelId
    }
  }
  dependsOn: [
    projectName_subscription
  ]
}

output endpointUri string = projectName_endpoint.properties.inferenceEndpoint.uri

Créez le déploiement comme suit :

az deployment group create --resource-group $RESOURCE_GROUP --template-file model-subscription.bicep

À tout moment, vous pouvez voir les points de terminaison associés à votre projet :

Vous pouvez utiliser les outils de gestion des ressources pour interroger les ressources. Le code suivant utilise Azure CLI :
```
az resource list \
    --query "[?type=='Microsoft.MachineLearningServices/workspaces/serverlessEndpoints']"
```
Le point de terminaison créé utilise une authentification par clé pour l’autorisation. Obtenez les clés associées au point de terminaison donné à l’aide d’API REST pour interroger ces informations.
Si vous devez utiliser ce déploiement à partir d’un autre projet ou hub, ou si vous envisagez d’utiliser Prompt Flow pour développer des applications intelligentes, il est nécessaire d’établir une connexion au déploiement de l’API serverless. Pour savoir comment configurer un déploiement d’API serverless existant sur un nouveau projet ou hub, consultez Utiliser le déploiement d’API serverless à partir d’un autre projet ou de Prompt flow.

Conseil / Astuce

Si vous utilisez Prompt flow dans le même projet ou hub où le déploiement a été réalisé, il est néanmoins nécessaire de créer la connexion.

Utiliser le déploiements d’API serverless

Les modèles déployés dans Azure Machine Learning et Foundry dans les déploiements d’API serverless prennent en charge les Azure API d’inférence de modèle IA qui expose un ensemble commun de fonctionnalités pour les modèles fondamentaux et qui peuvent être utilisés par les développeurs pour consommer des prédictions à partir d’un ensemble diversifié de modèles de manière uniforme et cohérente.

En savoir plus sur les fonctionnalités de cette API et découvrir comment vous pouvez l’utiliser lors de la création d’applications.

Supprimez les points de terminaison et les abonnements

Vous pouvez supprimer les abonnements et les points de terminaison de modèle. La suppression d’un abonnement à un modèle rend tout point de terminaison associé non sain et inutilisable.

Vous pouvez utiliser les outils de gestion des ressources pour gérer les ressources. Le code suivant utilise Azure CLI :

az resource delete --name <resource-name>

Partage via

Prerequisites

Rechercher votre modèle dans le catalogue de modèles

Déployer le modèle sur une API serverless

Utiliser le déploiements d’API serverless

Supprimez les points de terminaison et les abonnements

Rechercher votre modèle dans le catalogue de modèles

Déployer le modèle sur une API serverless

Utiliser le déploiements d’API serverless

Supprimez les points de terminaison et les abonnements

Rechercher votre modèle dans le catalogue de modèles

Déployer le modèle sur une API serverless

Utiliser le déploiements d’API serverless

Supprimez les points de terminaison et les abonnements

Rechercher votre modèle dans le catalogue de modèles

Déployer le modèle sur une API serverless

Utiliser le déploiements d’API serverless

Supprimez les points de terminaison et les abonnements

Considérations relatives au coût et au quota pour les modèles Foundry déployés en tant que déploiement d’API serverless

Autorisations requises pour s’abonner aux offres de modèles

Contenu connexe

Commentaires

Ressources supplémentaires