Delen via


Vectorizer voor Microsoft Foundry-modelcatalogus

Important

Deze vectorizer is in openbare preview onder aanvullende gebruiksvoorwaarden. Als u deze functie wilt gebruiken, raden we u aan de nieuwste preview-versie van Indexen - Maken of bijwerken (REST API) te gebruiken.

De Microsoft Foundry-modelcatalogusvectorizer maakt verbinding met een insluitmodel dat is geïmplementeerd vanuit de Foundry-modelcatalogus of een AML-eindpunt ( Azure Machine Learning ). Uw gegevens worden verwerkt in de geografische locatie waar uw model wordt geïmplementeerd.

Als u geïntegreerde vectorisatie gebruikt om de vectormatrices te maken, moet de vaardighedenset een AML-vaardigheid bevatten die verwijst naar hetzelfde model dat is opgegeven in de vectorizer.

Vereiste voorwaarden

Vectorizer-parameters

Parameters zijn hoofdlettergevoelig. De parameters die u gebruikt, zijn afhankelijk van de verificatie die uw modelprovider nodig heeft, indien van toepassing.

Parameternaam Description
uri (Vereist voor sleutelverificatie) De doel-URI van de serverloze implementatie uit de foundry-modelcatalogus of de score-URI van het online-eindpunt van AML. Alleen het HTTPS-URI-schema is toegestaan.
key (Vereist voor sleutelverificatie) De API-sleutel van de modelprovider.
resourceId (Vereist voor tokenverificatie) De Azure Resource Manager-resource-id van de modelprovider. Gebruik de subscriptions/{guid}/resourceGroups/{resource-group-name}/Microsoft.MachineLearningServices/workspaces/{workspace-name}/onlineendpoints/{endpoint_name} indeling voor een online AML-eindpunt.
modelName De naam van het insluitmodel uit de Foundry-modelcatalogus die is geïmplementeerd op de opgegeven uri. Ondersteunde modellen zijn:

  • Cohere-embed-v3-english
  • Cohere-embed-v3-multilingual
  • Cohere-embed-v4
region (Optioneel voor tokenverificatie) De regio waarin de modelprovider wordt geïmplementeerd. Vereist als de regio verschilt van de regio van de zoekservice.
timeout (Optioneel) De time-out voor de HTTP-client die de API-aanroep maakt. Deze moet worden opgemaakt als een XSD-waarde 'dayTimeDuration' (een beperkte subset van een ISO 8601-duurwaarde ). Bijvoorbeeld PT60S gedurende 60 seconden. Als dit niet is ingesteld, wordt een standaardwaarde van 30 seconden gekozen. De time-out kan worden ingesteld op maximaal 230 seconden en minimaal 1 seconde.

Welke verificatieparameters moeten worden gebruikt

De Vectorizer van de Microsoft Foundry-modelcatalogus biedt twee verificatieopties:

  • Verificatie op basis van sleutels. U geeft een statische sleutel op voor het verifiëren van scoreaanvragen van de vectorizer. Stel de uri en key parameters voor deze verbinding in.

  • Verificatie op basis van tokens. Het foundry hub-project of het online-eindpunt van AML wordt geïmplementeerd met behulp van verificatie op basis van tokens. De Azure AI Search-service moet een beheerde identiteit en een roltoewijzing hebben voor de modelprovider. De vectorizer gebruikt vervolgens de identiteit van de zoekservice om te verifiëren bij de modelprovider, zonder statische sleutels vereist. De identiteit van de zoekservice moet de rol Eigenaar of Inzender hebben. Stel de resourceId parameter in en als de zoekservice zich in een andere regio bevindt dan de modelprovider, stelt u de region parameter in.

Ondersteunde vectorquerytypen

Welke vectorquerytypen worden ondersteund door de Microsoft Foundry-modelcatalogusvectorizer, is afhankelijk van de modelName configuratie.

Model insluiten Ondersteunt text query's Ondersteunt imageUrl query's Ondersteunt imageBinary query's
Cohere-embed-v3-english X X
Cohere-embed-v3-multilingual X X
Cohere-embed-v4 X X

Verwachte velddimensies

De verwachte velddimensies voor een vectorveld dat is geconfigureerd met een Microsoft Foundry-modelcatalogusvectorizer, zijn afhankelijk van de modelName waarde die is geconfigureerd.

modelName Verwachte dimensies
Cohere-embed-v3-english 1024
Cohere-embed-v3-multilingual 1024
Cohere-embed-v4 256–1536

Voorbeelddefinitie

Voorgestelde modelnamen in de Foundry-modelcatalogus bestaan uit het basismodel plus een willekeurig achtervoegsel van drie letters. De naam van uw model verschilt van de naam die in dit voorbeeld wordt weergegeven.

"vectorizers": [
    {
        "name": "my-model-catalog-vectorizer",
        "kind": "aml",
        "amlParameters": {
            "uri": "https://Cohere-embed-v3-multilingual-hin.eastus.models.ai.azure.com",
            "key": "aaaaaaaa-0b0b-1c1c-2d2d-333333333333",
            "timeout": "PT60S",
            "modelName": "Cohere-embed-v3-multilingual-hin",
            "resourceId": null,
            "region": null,
        },
    }
]

Zie ook