Compartilhar via


Adicionar um recurso de índice de pesquisa de vetor a um aplicativo do Databricks

Adicione índices de pesquisa de vetor como recursos do Databricks Apps para habilitar a pesquisa semântica e a recuperação baseada em similaridade em seus aplicativos. Os índices de pesquisa vetorial armazenam e consultam incorporações vetoriais de alta dimensão, o que alimenta casos de uso como RAG (geração aumentada por recuperação), pesquisa semântica e sistemas de recomendação.

Requisitos de privilégio

Para acessar um índice de pesquisa de vetor, o principal de serviço do aplicativo deve ter o USE CATALOG privilégio no catálogo pai, o USE SCHEMA privilégio no esquema pai e o SELECT privilégio no índice. Quando você adiciona o recurso de índice, o Azure Databricks concede automaticamente esses privilégios à entidade de serviço do aplicativo.

Para que essa concessão automática seja bem-sucedida, um dos seguintes deve ser verdadeiro para cada privilégio:

  • Para USE CATALOG: ou todos os usuários da conta têm o USE CATALOG privilégio no catálogo, ou você tem o MANAGE privilégio no catálogo.
  • Para USE SCHEMA: Ou todos os usuários da conta possuem o privilégio USE SCHEMA no esquema, ou você possui o privilégio MANAGE no esquema.
  • Para SELECT: ou todos os usuários da conta têm o privilégio SELECT no índice; ou você tem o privilégio MANAGE no índice.

Para obter mais informações sobre como consultar índices de pesquisa de vetor com essas permissões, consulte Como consultar um índice de pesquisa de vetor.

Confira Privilégios e objetos protegíveis do Catálogo do Unity.

Adicionar um recurso de índice de pesquisa de vetor

Antes de adicionar um índice de pesquisa de vetor como um recurso, examine os pré-requisitos do recurso de aplicativo.

  1. Ao criar ou editar um aplicativo, navegue até a etapa Configurar.
  2. Na seção Recursos do aplicativo, clique em + Adicionar recurso.
  3. Selecione o índice de pesquisa vetor como o tipo de recurso.
  4. Escolha um índice de pesquisa de vetor nos índices disponíveis em seu workspace. O índice já deve existir no Catálogo do Unity.
  5. Selecione o nível de permissão do aplicativo:
    • Pode selecionar: Concede ao aplicativo permissão para consultar o índice de pesquisa de vetor para pesquisas de similaridade. Corresponde ao privilégio SELECT.
  6. (Opcional) Especifique uma chave de recurso personalizada, que é como você faz referência ao índice na configuração do aplicativo. A chave padrão é vector-search-index.

Observação

Os índices de pesquisa de vetor são tabelas do Catálogo do Unity com tipo TABLE_ONLINE_VECTOR_INDEX_REPLICA ou TABLE_ONLINE_VECTOR_INDEX_DIRECT. Ao selecionar um índice de pesquisa de vetor, você está selecionando uma tabela especialmente configurada que dá suporte a operações de pesquisa semântica.

Variáveis de ambiente

Quando você implanta um aplicativo com um recurso de índice de pesquisa de vetor, o Azure Databricks expõe o nome completo de três níveis por meio de variáveis de ambiente que você pode referenciar usando o valueFrom campo.

Configuração de exemplo:

env:
  - name: VECTOR_SEARCH_INDEX
    valueFrom: vector-search-index # Use your custom resource key if different

Usando o índice em seu aplicativo:

import os
from databricks.sdk import WorkspaceClient

# Access the vector search index name
index_name = os.getenv("VECTOR_SEARCH_INDEX")

# Initialize workspace client
w = WorkspaceClient()

# Query the vector search index
results = w.vector_search_indexes.query_index(
    index_name=index_name,
    query_text="What is machine learning?",
    num_results=10
)

# Process results
for result in results.manifest.columns:
    print(f"Result: {result}")

Para obter mais informações, consulte Usar variáveis de ambiente para acessar recursos.

Remover um recurso de índice de pesquisa de vetor

Quando um recurso de índice de pesquisa vetorial é removido de um aplicativo, a entidade de serviço desse aplicativo perde o acesso ao índice. O índice em si permanece inalterado e continua disponível para outros usuários e aplicativos que têm permissões apropriadas.

Práticas recomendadas

Considere o seguinte quando você trabalha com recursos de índice de pesquisa de vetor:

  • Verifique se a entidade de serviço do aplicativo tem acesso a fontes de dados subjacentes se o índice fizer referência a outras tabelas.
  • Monitore o desempenho da consulta e ajuste a configuração de índice ou os modelos de inserção se os tempos de resposta forem prejudicados.
  • Considere agendamentos de atualização de índice para manter as inserções sincronizadas com os dados de origem.
  • Use métricas de similaridade apropriadas (cosseno, euclidiano, produto de ponto) com base em seu modelo de inserção.