Teilen über


Vektorisierung des Azure KI Studio-Modellkatalogs

Wichtig

Dieses Feature befindet sich in der Public Preview-Phase und unterliegt zusätzlichen Nutzungsbedingungen. Die REST API-Version „2024-05-01-Preview“ unterstützt dieses Feature.

Die Vektorisierung des Azure KI Studio-Modellkatalogs stellt eine Verbindung mit einem Einbettungsmodell her, das über den Azure KI Studio-Modellkatalog an einem Azure Machine Learning-Endpunkt bereitgestellt wurde. Ihre Daten werden im Geo verarbeitet, in dem Ihr Modell bereitgestellt wird.

Vektorisierungsparameter

Bei den Parametern wird zwischen Groß- und Kleinschreibung unterschieden. Welche Parameter Sie verwenden, hängt davon ab, welche Authentifizierung für Ihren AML-Onlineendpunkt gegebenenfalls erforderlich ist.

Parametername Beschreibung
uri (Erforderlich) Der URI des AML-Onlineendpunkts, an den die JSON-Nutzdaten gesandt werden. Nur das HTTPS-URI-Schema ist zulässig.
modelName (Erforderlich) Die Modell-ID aus dem KI Studio-Modellkatalog, der am bereitgestellten Endpunkt bereitgestellt wird. Derzeit unterstützte Werte sind
  • OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch32
  • OpenAI-CLIP-Image-Text-Embeddings-ViT-Large-Patch14-336
  • Facebook-DinoV2-Image-Embeddings-ViT-Base
  • Facebook-DinoV2-Image-Embeddings-ViT-Giant
  • Cohere-embed-v3-english
  • Cohere-embed-v3-multilingual
key (Erforderlich für Schlüsselauthentifizierung) Der Schlüssel für den AML-Online-Endpunkt.
resourceId (Erforderlich für Tokenauthentifizierung). Die Azure Resource Manager-Ressourcen-ID des AML-Onlinenendpunkts. Er sollte im Format „subscriptions/{guid}/resourceGroups/{resource-group-name}/Microsoft.MachineLearningServices/workspaces/{workspace-name}/onlineendpoints/{endpoint_name}“ vorliegen.
region (Optional für Tokenauthentifizierung). Die Region, in der der AML-Onlineendpunkt bereitgestellt wird. Erforderlich, wenn sich die Region von der Region des Suchdiensts unterscheidet.
timeout (Optional) Wenn angegeben, wird damit das Zeitlimit für den HTTP-Client angegeben, der den API-Aufruf durchführt. Es muss als XSD-Wert „dayTimeDuration“ formatiert sein (eine eingeschränkte Teilmenge eines ISO 8601-Zeitwerts). Zum Beispiel PT60S für 60 Sekunden. Wenn kein Wert festgelegt ist, wird ein Standardwert von 30 Sekunden ausgewählt. Das Zeitlimit kann auf maximal 230 Sekunden und mindestens 1 Sekunde festgelegt werden.

Zu verwendende Authentifizierungsparameter

Welche Authentifizierungsparameter erforderlich sind, hängt davon ab, welche Authentifizierung Ihr AML-Onlineendpunkt gegebenenfalls verwendet. AML-Onlineendpunkte bieten zwei Authentifizierungsoptionen:

  • Schlüsselbasierte Authentifizierung. Ein statischer Schlüssel wird bereitgestellt, um Bewertungsanforderungen von der Vektorisierung zu authentifizieren.
    • Verwenden Sie die Parameter uri und key.
  • Tokenbasierte Authentifizierung. Der AML-Onlineendpunkt wird mithilfe der tokenbasierten Authentifizierungbereitgestellt. Die verwaltete Identität des Azure KI Suchdienstes muss aktiviert sein. Die Vektorisierung verwendet dann die verwaltete Identität des Diensts, um sich beim AML-Onlineendpunkt zu authentifizieren, ohne dass statische Schlüssel erforderlich sind. Der Identität muss die Rolle „Besitzer“ oder „Mitwirkender“ zugewiesen werden.
    • Verwenden Sie den resourceId-Parameter.
    • Wenn sich der Suchdienst in einer anderen Region als der AML-Arbeitsbereich befindet, verwenden Sie den Parameter region, um die Region festzulegen, in der der AML-Onlineendpunkt bereitgestellt wurde

Unterstützte Vektorabfragetypen

Welche Vektorabfragetypen von der Vektorisierung des KI Studio-Modellkatalogs unterstützt werden, hängt vom konfigurierten modelName ab.

modelName Unterstützt text-Abfrage Unterstützt imageUrl-Abfrage Unterstützt imageBinary-Abfrage
OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch32 X X X
OpenAI-CLIP-Image-Text-Embeddings-ViT-Large-Patch14-336 X X X
Facebook-DinoV2-Image-Embeddings-ViT-Base X X
Facebook-DinoV2-Image-Embeddings-ViT-Giant X X
Cohere-embed-v3-english X
Cohere-embed-v3-multilingual X

Erwartete Felddimensionen

Die erwarteten Felddimensionen für ein Feld, das mit einer Vektorisierung des KI Studio-Modellkatalogs konfiguriert ist, hängen vom konfigurierten modelName ab.

modelName Erwartete Dimensionen
OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch32 512
OpenAI-CLIP-Image-Text-Embeddings-ViT-Large-Patch14-336 768
Facebook-DinoV2-Image-Embeddings-ViT-Base 768
Facebook-DinoV2-Image-Embeddings-ViT-Giant 1536
Cohere-embed-v3-english 1024
Cohere-embed-v3-multilingual 1024

Beispieldefinition

"vectorizers": [
    {
        "name": "my-ai-studio-catalog-vectorizer",
        "kind": "aml",
        "amlParameters": {
            "uri": "https://my-aml-endpoint.eastus.inference.ml.azure.com/score",
            "key": "0000000000000000000000000000000000000",
            "timeout": "PT60S",
            "modelName": "OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch3",
            "resourceId": null,
            "region": null,
        },
    }
]

Weitere Informationen