Konsep agen data di Fabric (pratinjau)

Agen data di Microsoft Fabric adalah fitur Microsoft Fabric baru yang memungkinkan Anda membangun sistem Tanya Jawab Percakapan Anda sendiri dengan menggunakan AI generatif. Agen data Fabric membuat wawasan data lebih mudah diakses dan dapat ditindak lanjuti oleh semua orang di organisasi Anda. Dengan menggunakan agen data Fabric, tim Anda dapat melakukan percakapan, dengan pertanyaan bahasa Inggris biasa, tentang data yang disimpan organisasi Anda di Fabric OneLake lalu menerima jawaban yang relevan. Dengan cara ini, bahkan orang tanpa keahlian teknis dalam AI atau pemahaman mendalam tentang struktur data dapat menerima jawaban yang tepat dan kaya konteks.

Anda juga dapat menambahkan instruksi, contoh, dan panduan khusus organisasi untuk menyempurnakan agen data Fabric. Pendekatan ini memastikan bahwa respons selaras dengan kebutuhan dan tujuan organisasi Anda, memungkinkan semua orang untuk terlibat dengan data secara lebih efektif. Agen data Fabric menumbuhkan budaya pengambilan keputusan berbasis data karena menurunkan hambatan pada aksesibilitas wawasan, memfasilitasi kolaborasi, dan membantu organisasi Anda mengekstrak lebih banyak nilai dari datanya.

Penting

Fitur ini sedang dalam tahap pratinjau.

Prasyarat

Kapasitas F2 berbayar atau Fabric yang lebih tinggi, atau kapasitas Power BI Premium per kapasitas (P1 atau lebih tinggi) dengan Microsoft Fabric diaktifkan
Pengaturan tenant agen data Fabric aktif.
Pemrosesan lintas geografis untuk kecerdasan buatan diaktifkan.
Penyimpanan lintas geo untuk AI telah diaktifkan.
Setidaknya salah satu dari ini, dengan data: gudang, "lakehouse", satu atau beberapa model semantik Power BI, database KQL, atau ontologi.
Model semantik Power BI melalui pengalihan penyewa pada titik akhir XMLA diaktifkan untuk sumber data model semantik Power BI.

Cara kerja agen data Fabric

Agen data Fabric menggunakan model bahasa besar (LLM) untuk membantu pengguna berinteraksi dengan data mereka secara alami. Agen data Fabric menerapkan API Asisten Azure OpenAI dan berulah seperti agen. Ini memproses pertanyaan pengguna, menentukan sumber data yang paling relevan (Lakehouse, Gudang, himpunan data Power BI, database KQL, ontologi), dan memanggil alat yang sesuai untuk menghasilkan, memvalidasi, dan menjalankan kueri. Pengguna kemudian dapat mengajukan pertanyaan dalam bahasa biasa dan menerima jawaban yang terstruktur dan dapat dibaca manusia. Pendekatan ini menghilangkan kebutuhan untuk menulis kueri yang kompleks dan memastikan akses data yang akurat dan aman.

Berikut cara kerjanya secara rinci:

Penguraian dan validasi pertanyaan: Agen data Fabric menerapkan API Asisten Azure OpenAI sebagai agen yang mendasarinya untuk memproses pertanyaan pengguna. Pendekatan ini memastikan bahwa pertanyaan mematuhi protokol keamanan, kebijakan AI (RAI) yang bertanggung jawab, dan izin pengguna. Agen data Fabric dengan ketat memberlakukan akses yang hanya dapat dibaca, mempertahankan koneksi data yang hanya dapat dibaca ke semua sumber data.

Identifikasi sumber data: Agen data Fabric menggunakan kredensial pengguna untuk mengakses skema sumber data. Pendekatan ini memastikan bahwa sistem mengambil informasi struktur data yang memiliki izin untuk dilihat pengguna. Agen kemudian mengevaluasi pertanyaan pengguna terhadap semua sumber data yang tersedia, termasuk database relasional (Lakehouse dan Gudang), himpunan data Power BI (Model Semantik), database KQL, dan ontologi. Ini mungkin juga mereferensikan instruksi agen data yang disediakan pengguna untuk menentukan sumber data yang paling relevan.

Pemanggilan alat dan pembuatan kueri: Setelah sumber data atau sumber yang benar diidentifikasi, agen data Fabric menguraikan ulang pertanyaan untuk kejelasan dan struktur, lalu memanggil alat yang sesuai untuk menghasilkan kueri terstruktur:

Transformasi dari Bahasa Natural ke SQL (NL2SQL) untuk database relasional (Lakehouse/Warehouse).
Natural language to DAX (NL2DAX) untuk himpunan data Power BI (Model Semantik).
Konversi bahasa alami ke KQL (NL2KQL) untuk database KQL.

Alat yang dipilih menghasilkan kueri berdasarkan skema, metadata, dan konteks yang disediakan, yang kemudian diteruskan oleh agen yang mendasari agen data Fabric.

Validasi kueri: Alat ini melakukan validasi untuk memastikan kueri terbentuk dengan benar dan mematuhi protokol keamanan dan kebijakan RAI-nya sendiri.

Eksekusi dan respons kueri: Setelah divalidasi, agen data Fabric menjalankan kueri terhadap sumber data yang dipilih. Hasilnya diformat ke dalam respons yang dapat dibaca manusia, yang mungkin menyertakan data terstruktur seperti tabel, ringkasan, atau wawasan utama.

Dengan menggunakan pendekatan ini, pengguna dapat berinteraksi dengan data mereka dengan menggunakan bahasa alami. Agen data Fabric menangani kompleksitas pembuatan kueri, validasi, dan eksekusi. Pengguna tidak perlu menulis SQL, DAX, atau KQL itu sendiri.

Konfigurasi agen data fabric

Mengonfigurasi agen data Fabric mirip dengan membuat laporan Power BI—Anda mulai dengan merancang dan menyempurnakannya untuk memastikannya memenuhi kebutuhan Anda, lalu menerbitkan dan membagikannya dengan kolega sehingga mereka dapat berinteraksi dengan data. Menyiapkan agen data Fabric melibatkan:

Memilih Sumber Data: Agen data Fabric mendukung hingga lima sumber data dalam kombinasi apa pun, termasuk lakehouse, gudang, database KQL, model semantik Power BI, dan ontologi. Misalnya, agen data Fabric yang dikonfigurasi dapat menyertakan lima model semantik Power BI. Ini dapat mencakup campuran dua model semantik Power BI, satu lakehouse, dan satu database KQL. Anda memiliki banyak opsi yang tersedia.

Memilih Tabel yang Relevan: Setelah Anda memilih sumber data, tambahkan satu per satu, dan tentukan tabel tertentu dari setiap sumber yang digunakan agen data Fabric. Langkah ini memastikan bahwa agen data Fabric mengambil hasil yang akurat dengan hanya berfokus pada data yang relevan. Untuk lakehouse, langkah ini berarti memilih tabel lakehouse (bukan file lakehouse individual). Jika data Anda dimulai sebagai file (misalnya, CSV atau JSON), buatlah tersedia untuk agen dengan menyerapnya ke dalam tabel atau mengeksposnya melalui tabel.

Menambahkan Konteks: Untuk meningkatkan akurasi agen data Fabric, berikan lebih banyak konteks melalui instruksi agen data Fabric dan contoh kueri. Sebagai agen yang mendasari untuk agen data Fabric, konteks membantu Azure OpenAI Assistant API membuat keputusan yang lebih tepat tentang cara memproses pertanyaan pengguna, dan menentukan sumber data mana yang paling cocok untuk menjawabnya.

Instruksi agen data: Tambahkan instruksi untuk memandu agen yang mendasar agen data Fabric, dalam menentukan sumber data terbaik untuk menjawab jenis pertanyaan tertentu. Anda juga dapat memberikan aturan atau definisi kustom yang memperjelas terminologi organisasi atau persyaratan tertentu. Instruksi ini dapat memberikan lebih banyak konteks atau preferensi yang memengaruhi cara agen memilih dan mengkueri sumber data. Misalnya, arahkan pertanyaan langsung tentang metrik keuangan ke model semantik Power BI, alokasikan kueri yang berhubungan dengan eksplorasi data mentah ke lakehouse, dan salurkan pertanyaan yang memerlukan analisis log ke database KQL.
Contoh kueri: Tambahkan contoh pasangan kueri pertanyaan untuk menggambarkan bagaimana agen data Fabric harus merespons kueri umum. Contoh-contoh ini berfungsi sebagai panduan untuk agen, yang membantunya memahami cara menginterpretasikan pertanyaan serupa dan menghasilkan respons yang akurat.

Nota

Menambahkan contoh pasangan kueri/pertanyaan saat ini tidak didukung untuk sumber data model semantik Power BI.

Dengan menggabungkan instruksi AI yang jelas dan kueri contoh yang relevan, Anda dapat menyelaraskan agen data Fabric dengan kebutuhan data organisasi Anda dengan lebih baik, memastikan respons yang lebih akurat dan sadar konteks.

Perbedaan antara agen data Fabric dan copilot

Meskipun agen data Fabric dan pendamping Fabric menggunakan AI generatif untuk memproses dan menganalisis data, perbedaan kunci ada dalam fungsionalitas dan kasus penggunaannya.

Fleksibilitas Konfigurasi: Anda dapat sangat mengonfigurasi agen data Fabric. Anda dapat memberikan instruksi dan contoh kustom untuk menyesuaikan perilakunya dengan skenario tertentu. Salinan kain, di sisi lain, dikonfigurasi sebelumnya dan tidak menawarkan tingkat kustomisasi ini.

Cakupan dan Kasus Penggunaan: Copilot Fabric membantu dengan tugas-tugas dalam Microsoft Fabric, seperti menghasilkan kode untuk notebook atau kueri gudang. Agen data Fabric, sebaliknya, adalah artefak mandiri. Untuk membuat agen data Fabric lebih serbaguna untuk kasus penggunaan yang lebih luas, mereka dapat berintegrasi dengan sistem eksternal seperti Microsoft Copilot Studio, Azure AI Foundry, Microsoft Teams, atau alat lain di luar Fabric.

Evaluasi agen data dari Fabric

Tim produk secara ketat mengevaluasi kualitas dan keamanan respons agen data Fabric:

Benchmark Testing: Tim produk menguji agen data Fabric di berbagai himpunan data publik dan privat untuk memastikan respons berkualitas tinggi dan akurat.

Peningkatan Mitigasi Bahaya: Tim produk menerapkan perlindungan untuk memastikan bahwa output agen data Fabric tetap berfokus pada konteks sumber data yang dipilih, mengurangi risiko jawaban yang tidak relevan atau menyesatkan.

Keterbatasan

Agen data Fabric saat ini berada dalam pratinjau publik dan memiliki batasan. Pembaruan akan meningkatkan agen data Fabric dari waktu ke waktu.

Agen data Fabric hanya menghasilkan kueri "baca" SQL, DAX, dan KQL. Ini tidak menghasilkan kueri SQL, DAX, atau KQL yang membuat, memperbarui, atau menghapus data.
Agen data Fabric tidak mendukung data yang tidak terstruktur, seperti file .pdf, .docx, atau .txt. Anda tidak dapat menggunakan agen data Fabric untuk mengakses sumber daya data yang tidak terstruktur.
Untuk sumber data lakehouse, agen data Fabric menjawab pertanyaan menggunakan tabel lakehouse yang Anda pilih. Ia tidak langsung membaca file lakehouse mandiri seperti file CSV atau JSON kecuali file tersebut dimasukkan atau diekspos sebagai tabel.
Agen data Fabric saat ini tidak mendukung bahasa non-bahasa Inggris. Untuk performa optimal, berikan pertanyaan, instruksi, dan contoh kueri dalam bahasa Inggris.
Anda tidak dapat mengubah LLM yang digunakan agen data Fabric.
Riwayat percakapan di agen data Fabric mungkin tidak selalu bertahan. Dalam kasus tertentu, seperti perubahan infrastruktur backend, pembaruan layanan, atau peningkatan model, riwayat percakapan sebelumnya mungkin diatur ulang atau hilang.
Agen data Fabric tidak dapat menjalankan kueri saat kapasitas ruang kerja sumber data berada di wilayah yang berbeda dari kapasitas ruang kerja agen data. Misalnya, sebuah lakehouse dengan kapasitas di Eropa Utara akan mengalami kegagalan jika kapasitas Agen Data berada di Prancis Tengah.

Saran dan Komentar

Apakah halaman ini membantu?

Last updated on 2026-01-06