Partage via


Vectoriseur du catalogue de modèles Azure AI Studio

Important

Cette fonctionnalité est en préversion publique sous les conditions d’utilisation supplémentaires. L’API REST 2024-05-01-Preview prend en charge cette fonctionnalité.

Le vectoriseur du catalogue de modèles Azure AI Studio se connecte à un modèle d’incorporation déployé par le catalogue de modèles Azure AI Studio sur un point de terminaison Azure Machine Learning. Vos données sont traitées dans la zone géographique où votre modèle est déployé.

Paramètres du vectoriseur

Les paramètres respectent la casse. Les paramètres que vous choisissez d’utiliser dépendent de l’authentification dont votre point de terminaison en ligne AML a besoin, le cas échéant.

Nom du paramètre Description
uri (Obligatoire) L’URI du point de terminaison en ligne AML auquel la charge utile JSON est envoyée. Seul le schéma d’URI https est autorisé.
modelName (Obligatoire) L’ID de modèle du catalogue de modèles AI Studio déployé sur le point de terminaison fourni. Les valeurs actuellement prises en charge sont les suivantes
  • OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch32
  • OpenAI-CLIP-Image-Text-Embeddings-ViT-Large-Patch14-336
  • Facebook-DinoV2-Image-Embeddings-ViT-Base
  • Facebook-DinoV2-Image-Embeddings-ViT-Giant
  • Cohere-embed-v3-english
  • Cohere-embed-v3-multilingual
key (Requis pour l’authentification par clé) Clé du point de terminaison en ligne AML.
resourceId (Requis pour l’authentification par jeton). ID de ressource Azure Resource Manager du point de terminaison en ligne AML. Il doit être au format subscriptions/{guid}/resourceGroups/{resource-group-name}/Microsoft.MachineLearningServices/workspaces/{workspace-name}/onlineendpoints/{endpoint_name}.
region (Facultatif pour l’authentification par jeton). La région dans laquelle le point de terminaison en ligne AML est déployé. Nécessaire si la région est différente de celle du service de recherche.
timeout (Facultatif) Si spécifié, indique le délai d’expiration pour le client http qui effectue l’appel d’API. Il doit être formaté en tant que valeur « dayTimeDuration » XSD (un sous-ensemble limité d'une valeur de durée ISO 8601 ). Par exemple, PT60S pour 60 secondes. S’il n’est pas défini, une valeur par défaut de 30 secondes est choisie. Le délai d’expiration peut être défini sur 230 secondes maximum et 1 seconde minimum.

Quels paramètres d’authentification utiliser

Les paramètres d’authentification requis dépendent de l’authentification utilisée par votre point de terminaison AML en ligne, le cas échéant. Les points de terminaison en ligne AML fournissent deux options d’authentification :

  • Authentification basée sur une clé. Une clé statique est fournie pour authentifier les demandes de scoring du vectoriseur.
    • Utiliser les paramètres uri et key
  • Authentification basée sur un jeton. Le point de terminaison en ligne AML est déployé à l’aide de l’authentification basée sur des jetons. L’identité managée du service Recherche Azure AI doit être activée. Le vectoriseur utilise ensuite l’identité managée du service pour s’authentifier auprès du point de terminaison en ligne AML, sans besoin de clés statiques. L’identité doit avoir le rôle de propriétaire ou de contributeur.
    • Utiliser le paramètre resourceId
    • Si le service Recherche se trouve dans une autre région que celle de l’espace de travail AML, utilisez le paramètre région pour définir la région dans laquelle le point de terminaison en ligne AML a été déployé

Types de requêtes vectorielles pris en charge

Les types de requêtes vectorielles pris en charge par le vectoriseur du catalogue de modèles AI Studio dépendent de l’élément modelName configuré.

modelName Prend en charge la requête text Prend en charge la requête imageUrl Prend en charge la requête imageBinary
OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch32 X X X
OpenAI-CLIP-Image-Text-Embeddings-ViT-Large-Patch14-336 X X X
Facebook-DinoV2-Image-Embeddings-ViT-Base X X
Facebook-DinoV2-Image-Embeddings-ViT-Giant X X
Cohere-embed-v3-english X
Cohere-embed-v3-multilingual X

Dimensions attendues du champ

Les dimensions attendues du champ pour un champ configuré avec un vectoriseur du catalogue de modèles AI Studio dépendent de celles modelName configurées.

modelName Dimensions attendues
OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch32 512
OpenAI-CLIP-Image-Text-Embeddings-ViT-Large-Patch14-336 768
Facebook-DinoV2-Image-Embeddings-ViT-Base 768
Facebook-DinoV2-Image-Embeddings-ViT-Giant 1536
Cohere-embed-v3-english 1 024
Cohere-embed-v3-multilingual 1 024

Exemple de définition

"vectorizers": [
    {
        "name": "my-ai-studio-catalog-vectorizer",
        "kind": "aml",
        "amlParameters": {
            "uri": "https://my-aml-endpoint.eastus.inference.ml.azure.com/score",
            "key": "0000000000000000000000000000000000000",
            "timeout": "PT60S",
            "modelName": "OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch3",
            "resourceId": null,
            "region": null,
        },
    }
]

Voir aussi