Utiliser des points de terminaison d’API serverless à partir d’un espace de travail différent

Article
09/03/2024

Dans cet article, vous allez apprendre à configurer un point de terminaison d’API serverless existant dans un espace de travail différent de celui où il a été déployé.

Certains modèles du catalogue de modèles peuvent être déployés en tant qu’API serverless. Ce type de déploiement permet de consommer des modèles en tant qu’API sans les héberger sur votre abonnement, tout en conservant la sécurité et la conformité de l’entreprise dont les organisations ont besoin. Cette option de déploiement ne nécessite pas de quota à partir de votre abonnement.

Vous pouvez avoir besoin d’utiliser un point de terminaison d’API serverless existant dans un espace de travail différent de celui qui a servi à créer le déploiement, notamment dans les situations suivantes :

Vous souhaitez centraliser vos déploiements dans un espace de travail donné et les utiliser à partir d’espaces de travail différents au sein de votre organisation.
Vous devez déployer un modèle dans un espace de travail situé dans une région Azure déterminée où le déploiement serverless est possible pour ce modèle. Cependant, vous avez besoin de l’utiliser dans une autre région, où le déploiement serverless n’est pas possible pour le modèle en question.

Prérequis

Un abonnement Azure avec un moyen de paiement valide. Les abonnements Azure gratuits ou d’essai ne fonctionnent pas. Si vous ne disposez pas d’un abonnement Azure, commencez par créer un compte Azure payant.
Un espace de travail Azure Machine Learning où vous souhaitez utiliser le déploiement existant.
Un modèle déployé sur un point de terminaison d’API serverless. Cet article suppose que vous avez précédemment déployé le modèle Meta-Llama-3-8B-Instruct. Pour savoir comment déployer ce modèle en tant qu’API serverless, consultez Déployer des modèles en tant qu’API serverless.
Vous devez installer les logiciels suivants pour utiliser Azure Machine Learning :
Vous pouvez utiliser n’importe quel navigateur web compatible pour naviguer dans Azure Machine Learning studio.
L’interface Azure CLI et l’extension ml pour Azure Machine Learning.
```
az extension add -n ml
```
Si l’extension est déjà installée, vérifiez que la version installée est la plus récente.
```
az extension update -n ml
```
Une fois l’extension installée, configurez-la :
```
az account set --subscription <subscription>
az configure --defaults workspace=<workspace-name> group=<resource-group> location=<location>
```
Installez le kit de développement logiciel (SDK) Azure Machine Learning pour Python.
```
pip install -U azure-ai-ml
```
Une fois installée, importez les espaces de noms nécessaires :
```
from azure.ai.ml import MLClient
from azure.identity import InteractiveBrowserCredential
from azure.ai.ml.entities import ServerlessEndpoint, ServerlessConnection
```

Créer une connexion de point de terminaison d’API

Pour créer une connexion, effectuez les étapes suivantes :

Connectez-vous à l’espace de travail où le point de terminaison est déployé :
Accédez à Azure Machine Learning studio puis à l’espace de travail où le point de terminaison auquel vous souhaitez vous connecter est déployé.
Configurez l’interface CLI pour qu’elle pointe vers l’espace de travail :
```
az account set --subscription <subscription>
az configure --defaults workspace=<workspace-name> group=<resource-group> location=<location>
```
Créez un client connecté à votre espace de travail :
```
client = MLClient(
    credential=InteractiveBrowserCredential(tenant_id="<tenant-id>"),
    subscription_id="<subscription-id>",
    resource_group_name="<resource-group>",
    workspace_name="<workspace-name>",
)
```
Obtenez l’URL et les informations d’identification du point de terminaison auquel vous souhaitez vous connecter. Dans cet exemple, vous obtenez les détails d’un point de terminaison nommé meta-llama3-8b-qwerty.
1. Sélectionnez Points de terminaison dans la barre latérale gauche.
2. Sélectionnez l’onglet Points de terminaison serverless pour afficher les points de terminaison d’API serverless.
3. Sélectionnez le point de terminaison auquel vous souhaitez vous connecter.
4. Sous l’onglet Détails du point de terminaison, copiez les valeurs de URI cible et Clé.
```
az ml serverless-endpoint get-credentials -n meta-llama3-8b-qwerty
```
```
endpoint_name = "meta-llama3-8b-qwerty"
endpoint_keys = client.serverless_endpoints.get_keys(endpoint_name)
print(endpoint_keys.primary_key)
print(endpoint_keys.secondary_key)
```
À présent, connectez-vous à l’espace de travail où vous souhaitez créer la connexion et utiliser le point de terminaison.
Créez la connexion dans l’espace de travail :
1. Accédez à l’espace de travail où la connexion doit être créée.
2. Accédez à la section Gérer dans la barre de navigation gauche, puis sélectionnez Connexions.
3. Sélectionnez Créer.
4. Sélectionnez Modèle serverless.
5. Pour l’URI cible, collez la valeur que vous avez copiée précédemment.
6. Pour laclé, collez la valeur que vous avez copiée précédemment.
7. Donnez un nom à la connexion, dans ce cas meta-llama3-8b-connection.
8. Sélectionnez Ajouter une connexion.
Créer une définition de connexion :

connection.yml
```
name: meta-llama3-8b-connection
type: serverless
endpoint: https://meta-llama3-8b-qwerty-serverless.inference.ai.azure.com
api_key: 1234567890qwertyuiop
```
```
az ml connection create -f connection.yml
```
```
client.connections.create_or_update(ServerlessConnection(
    name="meta-llama3-8b-connection",
    endpoint="https://meta-llama3-8b-qwerty-serverless.inference.ai.azure.com",
    api_key="1234567890qwertyuiop"
))
```
À ce stade, la connexion est disponible pour la consommation.
Pour vérifier que la connexion fonctionne :
1. À partir de la barre de navigation gauche d’Azure Machine Learning studio, accédez à Création>Flux d’invite.
2. Sélectionnez Créer pour créer un flux.
3. Sélectionnez Créer dans la zone flux de conversation.
4. Donnez un nom à votre Flux d’invite, puis sélectionnez Créer.
5. Sélectionnez le nœud de conversation dans le graphique pour accéder à la section conversation.
6. Pour vous connecter, ouvrez la liste déroulante pour sélectionner la connexion que vous venez de créer, dans ce cas meta-llama3-8b-connection.
7. Sélectionnez Démarrer la session de calcul dans la barre de navigation supérieure pour démarrer un runtime automatique de flux d’invite.
8. Sélectionnez l’option conversation. Vous pouvez maintenant envoyer des messages et recevoir des réponses.

Partager via

Utiliser des points de terminaison d’API serverless à partir d’un espace de travail différent

Prérequis

Créer une connexion de point de terminaison d’API

Commentaires

Ressources supplémentaires

Partager via

Utiliser des points de terminaison d’API serverless à partir d’un espace de travail différent

Prérequis

Créer une connexion de point de terminaison d’API

Contenu connexe

Commentaires

Ressources supplémentaires