Megosztás a következőn keresztül:


Integrált vektorizáció implementálása az Azure AI Studióból származó modellek használatával

Fontos

Ez a funkció nyilvános előzetes verzióban érhető el a kiegészítő használati feltételek alatt. A 2024-05-01-preview REST API támogatja ezt a funkciót.

Ebből a cikkből megtudhatja, hogyan érheti el a beágyazási modelleket az Azure AI Studio modellkatalógusában vektorkonverziókhoz az indexelés és az Azure AI Search lekérdezései során.

A munkafolyamat tartalmazza a modell üzembe helyezésének lépéseit. A modellkatalógus az Azure OpenAI, a Cohere, a Facebook és az OpenAI modelljeinek beágyazását tartalmazza. A modell üzembe helyezése az egyes szolgáltatók számlázási struktúrája szerint számlázható.

A modell üzembe helyezése után használhatja az indexelés során integrált vektorizáláshoz, vagy lekérdezésekhez az AI Studio vektorizálójával.

Beágyazási modell üzembe helyezése az Azure AI Studio modellkatalógusából

  1. Nyissa meg az Azure AI Studio modellkatalógusát.

  2. Alkalmazzon egy szűrőt, hogy csak a beágyazási modellek jelenjenek meg. Az Inference tasks (Következtetési feladatok) területen válassza a Beágyazások elemet:

    Képernyőkép az Azure AI Studio modellkatalógusának oldaláról, amely kiemeli, hogyan szűrhet a modellek beágyazásával.

  3. Válassza ki azt a modellt, amellyel vektorizálni szeretné a tartalmat. Ezután válassza az Üzembe helyezés lehetőséget, és válasszon egy üzembe helyezési lehetőséget.

    Képernyőkép egy végpont Azure AI Studio-modellkatalóguson keresztüli üzembe helyezéséről.

  4. Adja meg a kért adatokat. Válasszon vagy hozzon létre egy új AI-projektet, majd válassza az Üzembe helyezés lehetőséget. Az üzembe helyezés részletei a kiválasztott modelltől függően változnak.

  5. Várja meg, amíg a modell a kiépítési állapot figyelésével befejezi az üzembe helyezést. A "Kiépítés" értékről "Frissítés"-ről "Sikeres" értékre kell változnia. Előfordulhat, hogy néhány percenként a Frissítés lehetőséget kell választania az állapotfrissítés megtekintéséhez.

  6. Másolja ki az URL-címet, az elsődleges kulcsot és a modellazonosítót, és tegye őket félre későbbre. Ezekre az értékekre szükség van a keresési index vektorizáló definíciója és a modell végpontjait indexelés során meghívó képességkészlet esetében.

    Szükség esetén módosíthatja a végpontot úgy, hogy a kulcsalapú hitelesítés helyett jogkivonat-hitelesítést használjon. Ha engedélyezi a jogkivonat-hitelesítést, csak az URL-címet és a modellazonosítót kell másolnia, és fel kell jegyeznie, hogy a modell melyik régióban van üzembe helyezve.

    Képernyőkép egy üzembe helyezett végpontról az AI Studióban, amely kiemeli a későbbi másoláshoz és mentéshez szükséges mezőket.

  7. Mostantól konfigurálhat egy keresési indexet és indexelőt az üzembe helyezett modell használatára.

Minta AML-képesség hasznos adatai

Amikor beágyazási modelleket helyez üzembe az Azure AI Studio modellkatalógusából, az Azure AI Search AML-képességével csatlakozik hozzájuk a számítási feladatok indexeléséhez.

Ez a szakasz az AML-képességdefiníciókat és az indexleképezéseket ismerteti. Olyan minta hasznos adatokat tartalmaz, amelyek már konfigurálva vannak a megfelelő üzembe helyezett végpontok használatára. A hasznos adatok működésével kapcsolatos további technikai részletekért olvassa el a Skill környezetét és a beviteli széljegyzet nyelvét.

Ez az AML-képesség hasznos adatai az AI Studio alábbi modelljeivel működnek:

  • OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch32
  • OpenAI-CLIP-Image-Text-Embeddings-ViT-Large-Patch14-336

Feltételezi, hogy a szöveg felosztási képességével osztja el a tartalmat, és hogy a vektorizálandó szöveg az /document/pages/* elérési úton van. Ha a szöveg egy másik elérési útról származik, ennek megfelelően frissítse az /document/pages/* elérési útra mutató összes hivatkozást.

Az URI és a kulcs a modell katalógusból való üzembe helyezésekor jön létre. További információ ezekről az értékekről: Nagy nyelvi modellek üzembe helyezése az Azure AI Studióval.

{
  "@odata.type": "#Microsoft.Skills.Custom.AmlSkill",
  "context": "/document/pages/*",
  "uri": "<YOUR_MODEL_URL_HERE>",
  "key": "<YOUR_MODEL_KEY_HERE>",
  "inputs": [
    {
      "name": "input_data",
      "sourceContext": "/document/pages/*",
      "inputs": [
        {
          "name": "columns",
          "source": "=['image', 'text']"
        },
        {
          "name": "index",
          "source": "=[0]"
        },
        {
          "name": "data",
          "source": "=[['', $(/document/pages/*)]]"
        }
      ]
    }
  ],
  "outputs": [
    {
      "name": "text_features"
    }
  ]
}

Minta AI Studio vektorizáló hasznos adatok

Az AI Studio vektorizáló az AML-képességtől eltérően csak az AI Studio modellkatalógusán keresztül üzembe helyezhető beágyazási modellekre van szabva. A fő különbség az, hogy nem kell aggódnia a kérelem és a válasz hasznos adatai miatt, de meg kell adnia azt modelNamea "Modellazonosítót", amelyet a modell AI Studióban való üzembe helyezése után másolt.

Íme egy minta hasznos adat arról, hogyan konfigurálná a vektorizálót az indexdefiníción az AI Studióból másolt tulajdonságok alapján.

A Cohere-modellek esetében NEM szabad az /v1/embed URL-cím végéhez hozzáadni az elérési utat, mint a szakértelemmel.

"vectorizers": [
    {
        "name": "<YOUR_VECTORIZER_NAME_HERE>",
        "kind": "aml",
        "amlParameters": {
            "uri": "<YOUR_URL_HERE>",
            "key": "<YOUR_PRIMARY_KEY_HERE>",
            "modelName": "<YOUR_MODEL_ID_HERE>"
        },
    }
]

Csatlakozás jogkivonat-hitelesítéssel

Ha nem tudja használni a kulcsalapú hitelesítést, ehelyett konfigurálhatja az AML-készséget és az AI Studio vektoros kapcsolatát a jogkivonat-hitelesítéshez szerepköralapú hozzáférés-vezérléssel az Azure-ban. A keresési szolgáltatásnak rendszer- vagy felhasználó által hozzárendelt felügyelt identitással kell rendelkeznie, és az identitásnak tulajdonosi vagy közreműködői engedélyekkel kell rendelkeznie az AML-projekt munkaterületéhez. Ezután eltávolíthatja a kulcsmezőt a képesség- és vektorizáló-definícióból, és lecserélheti a resourceId mezőre. Ha az AML-projekt és a keresési szolgáltatás különböző régiókban található, adja meg a régió mezőt is.

"uri": "<YOUR_URL_HERE>",
"resourceId": "subscriptions/<YOUR_SUBSCRIPTION_ID_HERE>/resourceGroups/<YOUR_RESOURCE_GROUP_NAME_HERE>/providers/Microsoft.MachineLearningServices/workspaces/<YOUR_AML_WORKSPACE_NAME_HERE>/onlineendpoints/<YOUR_AML_ENDPOINT_NAME_HERE>",
"region": "westus", // Only need if AML project lives in different region from search service

Következő lépések