Apa itu sumber pengetahuan?

Catatan

Beberapa fitur pengambilan agenik umumnya tersedia di REST API 2026-04-01 melalui akses terprogram. Portal Azure dan portal Microsoft Foundry terus menyediakan akses khusus pratinjau ke semua fitur pengambilan agenik. Untuk panduan migrasi, termasuk perincian tentang apa yang tersedia secara umum dan apa yang tetap ada dalam pratinjau, lihat Memigrasikan kode pengambilan agenik ke versi terbaru.

Jika Anda memilih menggunakan REST API pratinjau, Anda dapat mengakses kapabilitas pengambilan agentik yang belum tersedia untuk umum. Fitur pratinjau disediakan tanpa perjanjian tingkat layanan dan tidak disarankan untuk beban kerja produksi. Untuk informasi lebih lanjut, lihat Supplemental Terms of Use for Microsoft Azure Previews.

Important

Fitur dan fungsionalitas ini adalah bagian dari REST API pratinjau 2026-05-01. Pratinjau 2026-05-01 dilisensikan kepada Anda sebagai bagian dari langganan Azure Anda dan tunduk pada persyaratan yang berlaku untuk "Pratinjau" dalam Ketentuan Produk Microsoft, Adendum Perlindungan Data Produk dan Layanan Microsoft ("DPA"), dan Ketentuan Penggunaan Supplemental untuk Pratinjau Microsoft Azure.

Versi pratinjau 2026-05-01 mendukung koneksi ke layanan Microsoft dan layanan pihak ketiga. Penggunaan layanan ini tunduk pada persyaratan masing-masing dan dapat mengakibatkan pemrosesan data atau penyimpanan di luar batas kepatuhan Azure, serta data yang mengalir ke batas kepatuhan Azure.

Anda bertanggung jawab untuk mengelola apakah data Anda akan mengalir di luar batas kepatuhan dan geografis organisasi Anda dan implikasi terkait, dan bahwa izin, batas, dan persetujuan yang sesuai disediakan.

Anda bertanggung jawab untuk meninjau dan menguji aplikasi yang Anda buat dengan cermat dalam konteks kasus penggunaan spesifik Anda dan membuat semua keputusan dan penyesuaian yang sesuai. Ini termasuk menerapkan mitigasi AI Anda sendiri yang bertanggung jawab, seperti metaprompts, filter konten, atau sistem keamanan lainnya, dan memastikan aplikasi Anda memenuhi standar kualitas, keandalan, keamanan, dan kepercayaan yang sesuai. Untuk informasi selengkapnya, lihat Catatan Transparansi Pencarian Azure AI.

Sumber pengetahuan adalah sumber daya tingkat atas pada layanan Pencarian Azure AI Anda yang menentukan konten yang digunakan dalam alur pengambilan agenik. Setiap sumber pengetahuan diindeks atau jarak jauh, yang menentukan bagaimana konten diserap, diproses, dan dikueri. Sumber pengetahuan adalah komponen yang diperlukan dari pangkalan pengetahuan.

Anda dapat mereferensikan beberapa sumber pengetahuan dalam satu pangkalan pengetahuan. Mesin penelusuran agentic menjalankan kueri terhadap semuanya dalam satu permintaan. Subkueri dihasilkan untuk setiap sumber pengetahuan, dan hasil teratas dikembalikan dalam respons pengambilan data.

Sumber pengetahuan yang didukung

Pencarian Azure AI mendukung sumber pengetahuan berikut untuk beban kerja penelusuran agentik.

Jenis Description Terindeks atau jarak jauh
Indeks pencarian Membungkus indeks yang sudah ada. Diindeks
Azure Blob Menghasilkan alur pengindeks dari kontainer blob. Diindeks
Azure SQL (pratinjau) Menghasilkan alur pengindeks dari tabel atau tampilan Azure SQL. Diindeks
File (pratinjau) Mengunggah file langsung ke Pencarian Azure AI. Diindeks
OneLake Menghasilkan alur pengindeks dari lakehouse. Diindeks
SharePoint yang diindeks (pratinjau) Menghasilkan alur pengindeks dari situs SharePoint. Diindeks
SharePoint jarak jauh (pratinjau) Mengambil konten dari SharePoint. Jarak Jauh
Fabric Data Agent (pratinjau) Mengambil jawaban dan sumber daya yang disematkan dari agen data Microsoft Fabric. Jarak Jauh
Ontologi Fabric (pratinjau) Mengambil jawaban berbasis entitas dan hubungan dari ontologi Microsoft Fabric. Jarak Jauh
Server MCP (pratinjau) Mengambil hasil langsung yang didukung alat dari server MCP eksternal. Jarak Jauh
Work IQ (pratinjau) Mengambil kecerdasan organisasi dari Work IQ. Jarak Jauh
Web Mengambil data landasan waktu nyata dari Microsoft Bing. Jarak Jauh

Sumber pengetahuan terindeks

Sumber pengetahuan terindeks menunjuk ke indeks pencarian yang memenuhi kriteria untuk pengambilan agenik. Konten diserap ke dalam indeks sebelum waktu kueri melalui salah satu dari tiga jalur:

  • Bawa indeks Anda sendiri: Gunakan sumber pengetahuan indeks pencarian untuk membungkus indeks yang ada di layanan pencarian Anda.

  • Unggahan file langsung: Gunakan sumber pengetahuan file untuk mengunggah file langsung ke Pencarian Azure AI. Layanan memproses file dan menyimpan konten yang diekstrak dalam indeks pencarian yang dihasilkan, tanpa penyimpanan eksternal atau alur pengindeks yang diperlukan.

  • Alur pengindeks yang dihasilkan secara otomatis: Untuk semua sumber pengetahuan terindeks lainnya, Pencarian Azure AI secara otomatis membuat alur pengindeks lengkap dari sumber data eksternal Anda. Ini mencakup sumber data, kumpulan keterampilan, pengindeks, dan indeks yang telah diisi dan dibagi menjadi potongan-potongan.

Kueri berjalan secara lokal di layanan pencarian Anda menggunakan kata kunci (teks lengkap), vektor, atau kueri hibrid.

Sumber pengetahuan jarak jauh

Sumber pengetahuan jarak jauh terhubung langsung ke platform eksternal. Konten tidak pernah diserap ke dalam Pencarian Azure AI. Sebaliknya, data diambil saat kueri dijalankan melalui API bawaan masing-masing platform. Mesin retrieval agentik melakukan panggilan API dan menampilkan hasil beserta sumber pengetahuan yang telah diindeks dalam respons yang sama.

Tergantung pada platformnya, koneksi jarak jauh mengakses konten baik melalui internet publik (seperti Bing) maupun di dalam tenant Microsoft Anda (seperti SharePoint dan Fabric).

Peringkat terpadu

Untuk sumber pengetahuan terindeks dan jarak jauh, semua konten yang diambil mengalir melalui alur peringkat yang sama. Hasil dinilai berdasarkan relevansi, digabungkan antar kueri, dan diperingkatkan ulang sebelum dikembalikan dalam respons pengambilan.

Bekerja dengan sumber pengetahuan

Sumber pengetahuan adalah objek independen yang Anda buat dan kelola secara terpisah dari pangkalan pengetahuan. Ingatlah hal-hal berikut ini:

  • Buat sumber pengetahuan sebelum Anda membuat pangkalan pengetahuan. Pangkalan pengetahuan mereferensikan sumber pengetahuan berdasarkan ID, sehingga sumber pengetahuan harus ada terlebih dahulu.

  • Untuk menghapus sumber pengetahuan, pertama-tama perbarui atau hapus pangkalan pengetahuan apa pun yang mereferensikannya. Anda kemudian dapat menghapus sumber pengetahuan.

  • Sumber pengetahuan dan pangkalan pengetahuannya harus ada pada layanan pencarian yang sama.

Membuat sumber pengetahuan

Untuk membuat sumber pengetahuan, Anda memerlukan izin Kontributor Layanan Pencarian di layanan pencarian Anda. Jika sumber pengetahuan menghasilkan alur pengindeks, Anda juga memerlukan izin Kontributor Data Indeks Pencarian untuk memuat indeks. Anda dapat menggunakan kunci API admin sebagai alternatif untuk penetapan peran.

Dukungan pembuatan di portal Azure, portal Microsoft Foundry, REST API, dan Azure SDK bervariasi menurut jenis sumber pengetahuan. Untuk petunjuk per jenis, lihat tautan di Sumber pengetahuan yang didukung.

Menyerap label sensitivitas (pratinjau)

Untuk sumber pengetahuan blob, OneLake yang diindeks, dan SharePoint yang diindeks, Anda dapat mengimpor label sensitivitas Microsoft Purview dengan mengatur ingestionPermissionOptions agar menyertakan sensitivityLabel. Ikuti semua prasyarat sebelum Anda menetapkan nilai ini. Setelah disinkronkan ke indeks, label ditampilkan dalam respons pengambilan dan digunakan untuk menerapkan akses tingkat dokumen saat kueri dijalankan. Untuk informasi selengkapnya, lihat Menerapkan izin pada waktu kueri (pratinjau).

Jika sumber pengetahuan terindeks Anda menggunakan indeks terpotong, seperti dengan vektorisasi terintegrasi atau keterampilan Pemisahan Teks kustom, Anda juga harus memetakan label sensitivitas ke setiap baris potongan melalui proyeksi indeks dalam set keterampilan. Jika tidak, referensi pada tingkat potongan dalam respons pengambilan data tidak akan dikembalikan jika referensi tersebut memiliki label dalam dokumen sumber.

Tampilkan gambar yang disematkan dalam dokumen (pratinjau)

Untuk sumber pengetahuan blob, OneLake yang diindeks, dan SharePoint yang diindeks, Anda dapat mengonfigurasi assetStore di bagian ingestionParameters sumber pengetahuan untuk menyimpan gambar yang disematkan dalam dokumen sumber Anda. Ketika Anda juga mengaktifkan penyajian gambar di pangkalan pengetahuan, tindakan ambil menyuntikkan gambar tersebut ke dalam prompt sintesis jawaban sehingga LLM dapat beralasan atas diagram, bagan, dan konten gambar yang diekstrak. Untuk informasi selengkapnya, lihat Menampilkan gambar yang disematkan dalam dokumen dalam pengambilan agentik (pratinjau).

Menggunakan sumber pengetahuan

Setelah Anda membuat sumber pengetahuan, referensikan di pangkalan pengetahuan. Pangkalan pengetahuan menentukan sumber pengetahuan mana yang akan dikueri. Bagian berikut menjelaskan opsi untuk mengontrol sumber mana yang disertakan dan bagaimana mesin memilih di antara mereka.

Selalu telusuri sumber pengetahuan

Atur alwaysQuery ke true pada definisi sumber pengetahuan untuk menyertakannya dalam setiap kueri, terlepas dari upaya penalaran pengambilan.

Gunakan upaya penalaran pengambilan data untuk mengontrol penggunaan LLM (pratinjau)

Tingkat upaya penalaran penelusuran mengendalikan seberapa banyak pemrosesan LLM yang diterapkan pada setiap kueri. Tidak semua solusi mendapat manfaat dari perencanaan kueri LLM. Jika kesederhanaan dan kecepatan menjadi prioritas, gunakan upaya minimal untuk melewati pemrosesan LLM. Pada tingkat upaya low dan medium, LLM merencanakan dan memilih sumber pengetahuan mana yang akan diakses, dengan medium menambahkan iterasi tambahan untuk hasil yang lebih mendalam. Untuk informasi lebih lanjut tentang masing-masing tingkat, lihat Mengatur tingkat upaya penalaran untuk pengambilan (pratinjau).

Faktor-faktor berikut menjadi dasar pemilihan pada tingkat upaya low dan medium:

  • Sumber pengetahuan name.

  • Indeks description (untuk sumber pengetahuan terindeks).

  • retrievalInstructions yang ditentukan dalam definisi basis pengetahuan atau tindakan pengambilan. Instruksi pengambilan memandu sumber pengetahuan yang dipilih atau dilewati oleh LLM. Mereka berfungsi seperti perintah: Anda dapat menentukan brevity, nada, dan pemformatan.