Sdílet prostřednictvím


Přidání prostředku indexu vektorového vyhledávání do aplikace Databricks

Přidejte indexy vektorového vyhledávání jako prostředky Databricks Apps, které umožňují sémantické vyhledávání a načítání na základě podobnosti ve vašich aplikacích. Indexy vektorového vyhledávání ukládají a provádějí dotazy na vysoce dimenzionální vektorové vkládání, využívají případy použití, jako je generace rozšířená načítáním (RAG), sémantické vyhledávání a systémy doporučení.

Požadavky na oprávnění

Chcete-li získat přístup k indexu vektorového vyhledávání, musí mít instanční objekt aplikace oprávnění USE CATALOG pro nadřazený katalog, oprávnění USE SCHEMA pro nadřazené schéma a oprávnění SELECT k indexu. Když přidáte prostředek indexu, Azure Databricks tato oprávnění automaticky udělí instančnímu objektu aplikace.

Aby bylo toto automatické udělení úspěšné, musí být pro každé oprávnění splněno jedno z následujících podmínek:

  • Pro USE CATALOG: Buď všichni uživatelé účtu mají USE CATALOG oprávnění k katalogu, nebo máte MANAGE oprávnění v katalogu.
  • Pro USE SCHEMA: Buď všichni uživatelé účtu mají USE SCHEMA oprávnění ke schématu, nebo máte MANAGE oprávnění ke schématu.
  • Pro SELECT: Buď mají všichni uživatelé SELECT účtu oprávnění k indexu, nebo máte MANAGE oprávnění k indexu.

Další informace o dotazování indexů vektorového vyhledávání s těmito oprávněními naleznete v tématu Dotazování na index vektorového vyhledávání.

Viz oprávnění katalogu Unity a zabezpečitelné objekty.

Přidání prostředku indexu vektorového vyhledávání

Než přidáte index vektorového vyhledávání jako prostředek, projděte si požadavky na prostředek aplikace.

  1. Při vytváření nebo úpravě aplikace přejděte ke kroku Konfigurace .
  2. V části Prostředky aplikace klikněte na + Přidat prostředek.
  3. Jako typ prostředku vyberte index vektorového vyhledávání .
  4. Zvolte index vektorového vyhledávání z dostupných indexů ve vašem pracovním prostoru. Index už musí existovat v katalogu Unity.
  5. Vyberte úroveň oprávnění pro vaši aplikaci:
    • Může vybrat: Udělí aplikaci oprávnění k dotazování indexu vektorového vyhledávání na vyhledávání podobností. Odpovídá oprávnění SELECT
  6. (Volitelné) Zadejte vlastní klíč prostředku, což je způsob, jakým odkazujete na index v konfiguraci aplikace. Výchozí klíč je vector-search-index.

Poznámka:

Indexy vektorových vyhledávání jsou tabulky katalogu Unity s typem TABLE_ONLINE_VECTOR_INDEX_REPLICA nebo TABLE_ONLINE_VECTOR_INDEX_DIRECT. Když vyberete index vektorového vyhledávání, vyberete speciálně nakonfigurovanou tabulku, která podporuje sémantické operace hledání.

Proměnné prostředí

Když nasadíte aplikaci s prostředkem indexu vektorového vyhledávání, Azure Databricks zveřejní úplný tříúrovňový název prostřednictvím proměnných prostředí, na které můžete odkazovat pomocí valueFrom pole.

Příklad konfigurace:

env:
  - name: VECTOR_SEARCH_INDEX
    valueFrom: vector-search-index # Use your custom resource key if different

Použití indexu v aplikaci:

import os
from databricks.sdk import WorkspaceClient

# Access the vector search index name
index_name = os.getenv("VECTOR_SEARCH_INDEX")

# Initialize workspace client
w = WorkspaceClient()

# Query the vector search index
results = w.vector_search_indexes.query_index(
    index_name=index_name,
    query_text="What is machine learning?",
    num_results=10
)

# Process results
for result in results.manifest.columns:
    print(f"Result: {result}")

Další informace najdete v tématu Použití proměnných prostředí pro přístup k prostředkům.

Odstranit indexový prostředek vektorového vyhledávání

Když z aplikace odeberete prostředek indexu vektorového vyhledávání, služební principál aplikace ztratí přístup k indexu. Samotný index zůstane beze změny a bude nadále dostupný pro ostatní uživatele a aplikace, které mají příslušná oprávnění.

Osvědčené postupy

Při práci s prostředky indexu vektorového vyhledávání zvažte následující skutečnosti:

  • Pokud index odkazuje na jiné tabulky, ujistěte se, že služba principal aplikace má přístup k podkladovým zdrojům dat.
  • Monitorujte výkon dotazů a upravte konfiguraci indexu nebo modely vkládání, pokud dojde ke snížení doby odezvy.
  • Zvažte plány aktualizace indexu, aby se vkládání synchronizovala se zdrojovými daty.
  • Na základě modelu vkládání použijte odpovídající metriky podobnosti (kosinus, euclidean, tečkovaný produkt).