Bagikan melalui


Menambahkan sumber daya indeks pencarian vektor ke aplikasi Databricks

Tambahkan indeks pencarian vektor sebagai sumber daya Databricks Apps untuk mengaktifkan pencarian semantik dan pengambilan berbasis kesamaan di aplikasi Anda. Indeks pencarian vektor menyimpan dan melakukan kueri penyematan vektor dimensi tinggi, yang mendukung untuk kasus penggunaan seperti generasi dengan peningkatan penelusuran (RAG), pencarian semantik, dan sistem rekomendasi.

Persyaratan hak istimewa

Untuk mengakses indeks pencarian vektor, perwakilan layanan aplikasi harus memiliki USE CATALOG hak istimewa pada katalog induk, USE SCHEMA hak istimewa pada skema induk, dan SELECT hak istimewa pada indeks. Saat Anda menambahkan sumber daya indeks, Azure Databricks secara otomatis memberikan hak istimewa ini ke perwakilan layanan aplikasi.

Agar pemberian otomatis ini berhasil, salah satu hal berikut harus benar untuk setiap hak istimewa:

  • Untuk USE CATALOG: Semua pengguna akun memiliki USE CATALOG hak istimewa pada katalog, atau Anda memiliki MANAGE hak istimewa pada katalog.
  • Untuk USE SCHEMA: Semua pengguna akun memiliki USE SCHEMA hak istimewa pada skema, atau Anda memiliki MANAGE hak istimewa pada skema.
  • Untuk SELECT: Semua pengguna akun memiliki SELECT hak istimewa pada indeks, atau Anda memiliki MANAGE hak istimewa pada indeks.

Untuk informasi selengkapnya tentang mengkueri indeks pencarian vektor dengan izin ini, lihat Cara mengkueri indeks pencarian vektor.

Lihat Hak istimewa Unity Catalog dan objek yang dapat diamankan.

Menambahkan sumber daya indeks pencarian vektor

Sebelum Anda menambahkan indeks pencarian vektor sebagai sumber daya, tinjau prasyarat sumber daya aplikasi.

  1. Saat Anda membuat atau mengedit aplikasi, navigasikan ke langkah Konfigurasikan .
  2. Di bagian Sumber daya aplikasi , klik + Tambahkan sumber daya.
  3. Pilih Indeks pencarian vektor sebagai jenis sumber daya.
  4. Pilih indeks pencarian vektor dari indeks yang tersedia di ruang kerja Anda. Indeks harus sudah ada di Katalog Unity.
  5. Pilih tingkat izin untuk aplikasi Anda:
    • Dapat memilih: Memberikan izin aplikasi untuk mengkueri indeks pencarian vektor untuk pencarian kesamaan. SELECT Sesuai dengan hak istimewa.
  6. (Opsional) Tentukan kunci sumber daya kustom, yang merupakan cara Anda mereferensikan indeks dalam konfigurasi aplikasi Anda. Kunci defaultnya adalah vector-search-index.

Nota

Indeks pencarian vektor adalah tabel Unity Catalog dengan jenis TABLE_ONLINE_VECTOR_INDEX_REPLICA atau TABLE_ONLINE_VECTOR_INDEX_DIRECT. Saat Anda memilih indeks pencarian vektor, Anda memilih tabel yang dikonfigurasi khusus yang mendukung operasi pencarian semantik.

Variabel lingkungan

Saat Anda menyebarkan aplikasi dengan indeks pencarian berbasis vektor, Azure Databricks mengekspos nama tiga tingkat lengkap melalui variabel lingkungan yang dapat Anda referensikan menggunakan bidang valueFrom.

Konfigurasi contoh:

env:
  - name: VECTOR_SEARCH_INDEX
    valueFrom: vector-search-index # Use your custom resource key if different

Menggunakan indeks di aplikasi Anda:

import os
from databricks.sdk import WorkspaceClient

# Access the vector search index name
index_name = os.getenv("VECTOR_SEARCH_INDEX")

# Initialize workspace client
w = WorkspaceClient()

# Query the vector search index
results = w.vector_search_indexes.query_index(
    index_name=index_name,
    query_text="What is machine learning?",
    num_results=10
)

# Process results
for result in results.manifest.columns:
    print(f"Result: {result}")

Untuk informasi selengkapnya, lihat Menggunakan variabel lingkungan untuk mengakses sumber daya.

Menghapus sumber daya indeks pencarian vektor

Saat Anda menghapus sumber daya indeks pencarian vektor dari aplikasi, perwakilan layanan aplikasi kehilangan akses ke indeks. Indeks itu sendiri tetap tidak berubah dan terus tersedia untuk pengguna dan aplikasi lain yang memiliki izin yang sesuai.

Praktik terbaik

Pertimbangkan hal berikut saat Anda bekerja dengan sumber daya indeks pencarian vektor:

  • Pastikan perwakilan layanan aplikasi memiliki akses ke sumber data yang mendasar jika indeks mereferensikan tabel lain.
  • Pantau performa kueri dan sesuaikan konfigurasi indeks atau sematkan model jika waktu respons menurun.
  • Pertimbangkan jadwal refresh indeks untuk menjaga penyematan tetap sinkron dengan data sumber.
  • Gunakan metrik kesamaan yang sesuai (produk kosinus, euclidean, titik) berdasarkan model penyematan Anda.