Bagikan melalui


Apa itu sumber pengetahuan?

Nota

Fitur ini saat ini dalam pratinjau publik. Pratinjau ini disediakan tanpa perjanjian tingkat layanan dan tidak direkomendasikan untuk beban kerja produksi. Fitur tertentu mungkin tidak didukung atau mungkin memiliki kemampuan terbatas. Untuk informasi lebih lanjut, lihat Supplemental Terms of Use for Microsoft Azure Previews.

Sumber pengetahuan menentukan konten yang digunakan untuk pengambilan agenik. Ini merangkum indeks pencarian yang diisi oleh data eksternal, atau koneksi langsung ke target jarak jauh seperti Bing atau SharePoint yang dikueri secara langsung. Sumber pengetahuan adalah definisi yang diperlukan dalam pangkalan pengetahuan.

  • Buat sumber pengetahuan sebagai sumber daya tingkat atas di layanan pencarian Anda. Setiap sumber pengetahuan menunjuk ke tepat satu struktur data, baik indeks pencarian yang memenuhi kriteria untuk pengambilan agenik atau sumber daya eksternal yang didukung.

  • Referensikan satu atau beberapa sumber pengetahuan dalam pangkalan pengetahuan. Dalam alur pengambilan agenik, Anda dapat membuat kueri terhadap beberapa sumber pengetahuan dalam satu permintaan. Subkueri dihasilkan untuk setiap sumber pengetahuan. Hasil teratas dikembalikan dalam respons pengambilan.

  • Untuk sumber pengetahuan tertentu, Anda dapat menggunakan definisi sumber pengetahuan untuk menghasilkan alur pengindeks penuh (sumber data, skillset, pengindeks, dan indeks) yang berfungsi untuk pengambilan agenik. Alih-alih membuat beberapa objek secara manual, informasi dalam sumber pengetahuan digunakan untuk menghasilkan semua objek, termasuk indeks yang diisi, dipotong, dan dapat dicari.

Pastikan Anda memiliki setidaknya satu sumber pengetahuan sebelum membuat pangkalan pengetahuan. Spesifikasi lengkap sumber pengetahuan dan pangkalan pengetahuan dapat ditemukan dalam referensi PRATINJAU REST API.

Bekerja dengan sumber pengetahuan

  • Jalur pembuatan: pertama-tama buat sumber pengetahuan, lalu buat pangkalan pengetahuan.

  • Jalur penghapusan: perbarui atau hapus pangkalan pengetahuan untuk menghapus referensi ke sumber pengetahuan, lalu hapus sumber pengetahuan terakhir.

  • Sumber pengetahuan, indeksnya, dan pangkalan pengetahuan semuanya harus ada pada layanan pencarian yang sama. Konten eksternal diakses melalui internet publik (Bing) atau di penyewa Microsoft (SharePoint jarak jauh).

Sumber pengetahuan yang didukung

Dalam pratinjau ini, Anda dapat membuat sumber pengetahuan berikut:

Kind Terindeks atau jarak jauh
"searchIndex" API membungkus indeks yang ada. Diindeks
"azureBlob" API menghasilkan alur pengindeksan yang mengekstraksi dari kontainer blob. Diindeks
"indexedOneLake" API menghasilkan pipa pengindeksan yang mengambil data dari lakehouse. Diindeks
"indexedSharePoint" API menghasilkan pipeline pengindeks yang mengambil dari situs SharePoint. Diindeks
"remoteSharePoint" API mengambil konten langsung dari SharePoint. Remote
"webParameters" API mengambilkan data grounding real-time dari Microsoft Bing. Remote

Sumber pengetahuan terindeks menunjuk ke indeks target di Azure AI Search. Eksekusi kueri bersifat lokal untuk mesin pencari di layanan pencarian Anda. Kata kunci (pencarian teks lengkap), kemampuan kueri vektor, dan hibrid digunakan untuk mengambil data dari sumber pengetahuan terindeks.

Anda mengakses sumber pengetahuan jarak jauh saat melakukan kueri. Mesin pengambilan agenik memanggil API pengambilan yang asli ke platform (API Bing atau SharePoint).

Semua konten yang diperoleh, baik yang diindeks maupun dari jarak jauh, dimasukkan ke dalam proses peringkat di Azure AI Search, di mana konten dinilai relevansinya, digabungkan (dengan asumsi beberapa kueri), diurutkan kembali, dan dikembalikan dalam respons pengambilan.

Membuat sumber pengetahuan

Buat sumber pengetahuan sebagai objek mandiri. Kemudian, tentukan dalam pangkalan pengetahuan dalam array "knowledgeSources".

Untuk membuat objek pada layanan pencarian, Anda memerlukan izin Kontributor Layanan Pencarian. Jika Anda menggunakan sumber pengetahuan yang membuat alur pengindeks, Anda juga memerlukan izin Kontributor Data Indeks Pencarian untuk memuat indeks. Atau, Anda dapat menggunakan kunci admin API alih-alih peran.

Gunakan portal Microsoft Azure, REST API, atau paket pratinjau Azure SDK untuk membuat sumber pengetahuan. Tautan berikut ini menyediakan instruksi untuk membuat sumber pengetahuan:

Setelah Anda membuat sumber pengetahuan, referensikan di pangkalan pengetahuan.

Menggunakan sumber pengetahuan

Anda dapat secara eksplisit mengontrol penggunaan sumber pengetahuan dengan mengatur alwaysQuery definisi sumber pengetahuan atau melalui instruksi kemudi yang digunakan selama perencanaan kueri. Instruksi kemudi mengacu pada deskripsi pada indeks, atau instruksi pengambilan eksplisit di sumber pengetahuan, yang memberikan panduan tentang kapan menggunakan indeks. Perencanaan kueri terjadi saat Anda menggunakan upaya penalaran pengambilan kembali yang rendah atau sedang dari LLM. Untuk upaya penalaran minimal, semua sumber pengetahuan yang tercantum di pangkalan pengetahuan berada dalam cakupan untuk setiap kueri. Untuk tingkat rendah dan sedang, basis pengetahuan dan LLM dapat menentukan saat kueri sumber pengetahuan mana yang berpeluang memberikan korpus pencarian terbaik.

Logika pemilihan sumber pengetahuan didasarkan pada faktor-faktor ini:

  • Sudah alwaysQuery diatur? Jika ya, sumber pengetahuan selalu digunakan pada setiap kueri.

  • Sumber pengetahuan name.

  • Indeks description , dengan asumsi sumber pengetahuan terindeks.

  • Yang retrievalInstructions ditentukan dalam tindakan ambil atau dalam definisi pangkalan pengetahuan menyediakan panduan yang mencakup atau mengecualikan sumber pengetahuan. Ini mirip dengan perintah. Anda dapat menentukan brevity, nada, dan pemformatan sebagai instruksi pengambilan.

  • outputMode pada pangkalan pengetahuan juga memengaruhi hasil kueri dan isi dari respons.

Gunakan upaya penalaran berbasis pengambilan untuk mengontrol penggunaan LLM

Tidak semua solusi mendapat manfaat dari perencanaan dan eksekusi kueri LLM. Jika kesederhanaan dan kecepatan melebihi manfaat yang diberikan perencanaan kueri LLM dan rekayasa konteks, tentukan upaya penalaran minimal untuk mencegah pemrosesan LLM di alur Anda.

Untuk tingkat rendah dan sedang, pemrosesan LLM dilakukan dengan pendekatan seimbang atau maksimal yang meningkatkan relevansi. Untuk informasi selengkapnya, lihat Mengatur upaya penalaran pengambilan.

Nota

Jika Anda menggunakan attemptFastPath di pratinjau sebelumnya, pendekatan itu sekarang digantikan dengan retrievalReasoningEffort ditetapkan ke minimal.