Freigeben über


Vektorisierung des Azure KI Studio-Modellkatalogs

Wichtig

Dieser Vektorizer befindet sich in der öffentlichen Vorschau unter ergänzenden Nutzungsbedingungen. Die REST API-Version „2024-05-01-Preview“ unterstützt dieses Feature.

Die Vektorisierung des Azure KI Studio-Modellkatalogs stellt eine Verbindung mit einem Einbettungsmodell her, das über den Azure KI Studio-Modellkatalog an einem Azure Machine Learning-Endpunkt bereitgestellt wurde. Ihre Daten werden im geografischen Raum verarbeitet, in dem Ihr Modell bereitgestellt wird.

Wenn Sie die integrierte Vektorisierung zum Erstellen der Vektorarrays verwendet haben, sollte das Skillset eine AML-Fähigkeit enthalten, die auf den Modellkatalog in Azure AI Studio (Vorschau) zeigt.

Vektorisierungsparameter

Bei den Parametern wird zwischen Groß- und Kleinschreibung unterschieden. Welche Parameter Sie verwenden, hängt davon ab, welche Authentifizierung für Ihren AML-Onlineendpunkt gegebenenfalls erforderlich ist.

Parametername Beschreibung
uri (Erforderlich) Der URI des AML-Onlineendpunkts, an den die JSON-Nutzdaten gesandt werden. Nur das HTTPS-URI-Schema ist zulässig.
modelName (Erforderlich) Die Modell-ID aus dem KI Studio-Modellkatalog, der am bereitgestellten Endpunkt bereitgestellt wird. Derzeit unterstützte Werte sind
  • OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch32
  • OpenAI-CLIP-Image-Text-Embeddings-ViT-Large-Patch14-336
  • Facebook-DinoV2-Image-Embeddings-ViT-Base
  • Facebook-DinoV2-Image-Embeddings-ViT-Giant
  • Cohere-embed-v3-english
  • Cohere-embed-v3-multilingual
key (Erforderlich für Schlüsselauthentifizierung) Der Schlüssel für den AML-Online-Endpunkt.
resourceId (Erforderlich für Tokenauthentifizierung). Die Azure Resource Manager-Ressourcen-ID des AML-Onlinenendpunkts. Er sollte im Format „subscriptions/{guid}/resourceGroups/{resource-group-name}/Microsoft.MachineLearningServices/workspaces/{workspace-name}/onlineendpoints/{endpoint_name}“ vorliegen.
region (Optional für Tokenauthentifizierung). Die Region, in der der AML-Onlineendpunkt bereitgestellt wird. Erforderlich, wenn sich die Region von der Region des Suchdiensts unterscheidet.
timeout (Optional) Wenn angegeben, wird damit das Zeitlimit für den HTTP-Client angegeben, der den API-Aufruf durchführt. Es muss als XSD-Wert „dayTimeDuration“ formatiert sein (eine eingeschränkte Teilmenge eines ISO 8601-Zeitwerts). Zum Beispiel PT60S für 60 Sekunden. Wenn kein Wert festgelegt ist, wird ein Standardwert von 30 Sekunden ausgewählt. Das Zeitlimit kann auf maximal 230 Sekunden und mindestens 1 Sekunde festgelegt werden.

Zu verwendende Authentifizierungsparameter

Welche Authentifizierungsparameter erforderlich sind, hängt davon ab, welche Authentifizierung Ihr AML-Onlineendpunkt gegebenenfalls verwendet. AML-Onlineendpunkte bieten zwei Authentifizierungsoptionen:

  • Schlüsselbasierte Authentifizierung. Ein statischer Schlüssel wird bereitgestellt, um Bewertungsanforderungen von der Vektorisierung zu authentifizieren.
    • Verwenden Sie die Parameter uri und key.
  • Tokenbasierte Authentifizierung. Der AML-Onlineendpunkt wird mithilfe der tokenbasierten Authentifizierungbereitgestellt. Die verwaltete Identität des Azure KI Suchdienstes muss aktiviert sein. Die Vektorisierung verwendet dann die verwaltete Identität des Diensts, um sich beim AML-Onlineendpunkt zu authentifizieren, ohne dass statische Schlüssel erforderlich sind. Der Identität muss die Rolle „Besitzer“ oder „Mitwirkender“ zugewiesen werden.
    • Verwenden Sie den resourceId-Parameter.
    • Wenn sich der Suchdienst in einer anderen Region als der AML-Arbeitsbereich befindet, verwenden Sie den Parameter region, um die Region festzulegen, in der der AML-Onlineendpunkt bereitgestellt wurde

Unterstützte Vektorabfragetypen

Welche Vektorabfragetypen von der Vektorisierung des KI Studio-Modellkatalogs unterstützt werden, hängt vom konfigurierten modelName ab.

modelName Unterstützt text-Abfrage Unterstützt imageUrl-Abfrage Unterstützt imageBinary-Abfrage
OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch32 X X X
OpenAI-CLIP-Image-Text-Embeddings-ViT-Large-Patch14-336 X X X
Facebook-DinoV2-Image-Embeddings-ViT-Base X X
Facebook-DinoV2-Image-Embeddings-ViT-Giant X X
Cohere-embed-v3-english X
Cohere-embed-v3-multilingual X

Erwartete Felddimensionen

Die erwarteten Felddimensionen für ein Feld, das mit einer Vektorisierung des KI Studio-Modellkatalogs konfiguriert ist, hängen vom konfigurierten modelName ab.

modelName Erwartete Dimensionen
OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch32 512
OpenAI-CLIP-Image-Text-Embeddings-ViT-Large-Patch14-336 768
Facebook-DinoV2-Image-Embeddings-ViT-Base 768
Facebook-DinoV2-Image-Embeddings-ViT-Giant 1536
Cohere-embed-v3-english 1024
Cohere-embed-v3-multilingual 1024

Beispieldefinition

"vectorizers": [
    {
        "name": "my-ai-studio-catalog-vectorizer",
        "kind": "aml",
        "amlParameters": {
            "uri": "https://my-aml-endpoint.eastus.inference.ml.azure.com/score",
            "key": "0000000000000000000000000000000000000",
            "timeout": "PT60S",
            "modelName": "OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch3",
            "resourceId": null,
            "region": null,
        },
    }
]

Weitere Informationen