Megosztás:


Vektorkeresési indexerőforrás hozzáadása Egy Databricks-alkalmazáshoz

Adjon hozzá vektoros keresési indexeket Databricks Apps-erőforrásokként a szemantikai keresés és a hasonlóságalapú lekérés engedélyezéséhez az alkalmazásokban. A vektorkeresési indexek nagy dimenziójú vektorbeágyazásokat tárolnak és lekérdezik, lehetővé téve olyan használati eseteket, mint a lekérés által bővített generáció (RAG), a szemantikai keresés és a javaslati rendszerek.

Jogosultsági követelmények

A vektorkeresési index eléréséhez az alkalmazás szolgáltatási főfelhasználónak rendelkeznie kell a USE CATALOG szülőkatalógusban lévő jogosultsággal, a USE SCHEMA szülősémán lévő jogosultsággal, és az SELECT indexen lévő jogosultsággal. Az indexer forrás hozzáadásakor az Azure Databricks automatikusan megadja ezeket a jogosultságokat az alkalmazás szolgáltatási főszereplőjének.

Ahhoz, hogy ez az automatikus engedélyezés sikeres legyen, az alábbiak egyikének igaznak kell lennie az egyes jogosultságokra:

  • A következőhöz USE CATALOG: Vagy minden fiókfelhasználó rendelkezik jogosultsággal USE CATALOG a katalógusban, vagy Ön rendelkezik a MANAGE katalógusban lévő jogosultsággal.
  • A következőhöz USE SCHEMA: Vagy minden fiókfelhasználó rendelkezik USE SCHEMA jogosultsággal a sémán, vagy Ön rendelkezik MANAGE jogosultsággal a sémán.
  • A következőhöz SELECT: Vagy minden fiókfelhasználó rendelkezik jogosultsággal SELECT az indexen, vagy Ön rendelkezik jogosultsággal MANAGE az indexen.

A vektorkeresési indexek ezen engedélyekkel való lekérdezéséről további információt a Vektorkeresési index lekérdezése című témakörben talál.

Lásd: Unity Catalog-jogosultságok és biztonságos objektumok.

Vektorkeresési indexerőforrás hozzáadása

Mielőtt vektorkeresési indexet ad hozzá erőforrásként, tekintse át az alkalmazáserőforrás előfeltételeit.

  1. Alkalmazás létrehozásakor vagy szerkesztésekor lépjen a Konfigurálás lépésre.
  2. Az Alkalmazáserőforrások szakaszban kattintson az + Erőforrás hozzáadása elemre.
  3. Erőforrástípusként válassza a Vektorkeresési index lehetőséget.
  4. Válasszon ki egy vektoros keresési indexet a munkaterületen elérhető indexekből. Az indexnek már léteznie kell a Unity Katalógusban.
  5. Válassza ki az alkalmazás jogosultsági szintjét:
    • Kiválaszthatja a következőt: Engedélyt ad az alkalmazásnak a vektorkeresési index hasonlósági keresésekhez való lekérdezéséhez. A SELECT jogosultságnak felel meg.
  6. (Nem kötelező) Adjon meg egy egyéni erőforráskulcsot, így hivatkozhat az indexre az alkalmazáskonfigurációban. Az alapértelmezett kulcs a következő vector-search-index.

Megjegyzés:

A vektorkeresési indexek a Unity Catalog táblái TABLE_ONLINE_VECTOR_INDEX_REPLICA vagy TABLE_ONLINE_VECTOR_INDEX_DIRECT típusúak. Vektorkeresési index kiválasztásakor egy speciálisan konfigurált táblát választ ki, amely támogatja a szemantikai keresési műveleteket.

Környezeti változók

Amikor vektorkeresési indexerőforrással üzembe helyez egy alkalmazást, az Azure Databricks a teljes háromszintű nevet környezeti változókon keresztül teszi elérhetővé, amelyekre a valueFrom mező használatával hivatkozhat.

Példakonfiguráció:

env:
  - name: VECTOR_SEARCH_INDEX
    valueFrom: vector-search-index # Use your custom resource key if different

Az index használata az alkalmazásban:

import os
from databricks.sdk import WorkspaceClient

# Access the vector search index name
index_name = os.getenv("VECTOR_SEARCH_INDEX")

# Initialize workspace client
w = WorkspaceClient()

# Query the vector search index
results = w.vector_search_indexes.query_index(
    index_name=index_name,
    query_text="What is machine learning?",
    num_results=10
)

# Process results
for result in results.manifest.columns:
    print(f"Result: {result}")

További információ: Környezeti változók használata erőforrások eléréséhez.

Vektorkeresési index erőforrásának eltávolítása

Amikor eltávolít egy vektorkeresési indexerőforrást egy alkalmazásból, az alkalmazás szolgáltatásnév elveszíti az indexhez való hozzáférést. Maga az index változatlan marad, és továbbra is elérhető lesz más, megfelelő engedélyekkel rendelkező felhasználók és alkalmazások számára.

Ajánlott eljárások

A vektorkeresési index erőforrásainak használatakor vegye figyelembe a következőket:

  • Győződjön meg arról, hogy az alkalmazás szolgáltatásnévének hozzáférése van a mögöttes adatforrásokhoz, ha az index más táblákra hivatkozik.
  • A lekérdezési teljesítmény monitorozása, és az indexkonfiguráció vagy a beágyazási modellek módosítása, ha a válaszidő romlik.
  • Fontolja meg az indexfrissítés ütemezését, hogy a beágyazások szinkronizálva maradjanak a forrásadatokkal.
  • A beágyazási modell alapján használjon megfelelő hasonlósági metrikákat (koszinusz, euklideszi, pont termék).