Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Dengan agen data di Microsoft Fabric, Anda dapat membuat pengalaman AI percakapan yang menjawab pertanyaan tentang data yang disimpan di lakehouse, gudang data, model semantik Power BI, database KQL, dan ontologi di Fabric. Kolega Anda dapat mengajukan pertanyaan dalam bahasa Inggris biasa dan menerima jawaban berbasis data, bahkan jika mereka bukan ahli AI atau sangat terbiasa dengan data.
Penting
Fitur ini sedang dalam tahap pratinjau.
Prasyarat
- Kapasitas F2 berbayar atau Fabric yang lebih tinggi, atau kapasitas Power BI Premium per kapasitas (P1 atau lebih tinggi) dengan Microsoft Fabric diaktifkan
- Konfigurasi penyewa agen data Fabric diaktifkan.
- Pemrosesan lintas geografis untuk kecerdasan buatan diaktifkan.
- Penyimpanan lintas geo untuk AI telah diaktifkan.
- Setidaknya salah satu dari ini, dengan data: gudang, "lakehouse", satu atau beberapa model semantik Power BI, database KQL, atau ontologi.
- Pengalihan penyewa titik akhir XMLA untuk model semantik Power BI diaktifkan untuk sumber data model semantik Power BI.
Autentikasi dan token
Anda tidak perlu membuat atau menyediakan kunci Azure OpenAI atau token akses untuk menggunakan agen data Fabric. Fabric menggunakan Asisten Azure OpenAI yang dikelola Microsoft dan menangani autentikasi untuk Anda.
- Akses data berjalan di bawah identitas pengguna ID Microsoft Entra dan izin ruang kerja/data Anda. Agen membaca skema dan menjalankan SQL/DAX/KQL hanya jika Anda memiliki akses.
- Untuk menambahkan model semantik Power BI sebagai sumber data, Anda memerlukan izin Baca pada model tersebut (Tulis tidak diperlukan). Akses baca juga cukup untuk mengajukan pertanyaan terhadap sumber yang dapat Anda akses. Untuk informasi selengkapnya tentang izin model semantik, lihat Himpunan data dan keamanan model semantik.
- Jika organisasi Anda menggunakan kapasitas Power BI Premium per kapasitas (P1 atau lebih tinggi) alih-alih SKU F, pastikan Microsoft Fabric diaktifkan pada kapasitas tersebut.
- Perwakilan layanan dan token API tidak diperlukan untuk pengalaman obrolan dalam produk. Otomatisasi apa pun dengan perwakilan layanan adalah skenario terpisah dan tidak tercakup di sini.
Aliran end-to-end untuk membuat dan mengonsumsi agen data Fabric
Bagian ini menguraikan langkah-langkah utama untuk membuat, memvalidasi, dan berbagi agen data Fabric di Fabric, sehingga dapat diakses untuk dikonsumsi.
Prosesnya mudah dan Anda dapat mulai menguji sumber daya agen data Fabric dalam hitungan menit.
Membuat agen data Fabric baru
Untuk membuat agen data Fabric baru, pertama-tama buka ruang kerja Anda, dan kemudian pilih tombol + Item Baru. Di tab Semua item, cari agen data Fabric untuk menemukan opsi yang sesuai, seperti yang ditunjukkan pada cuplikan layar ini.
Setelah dipilih, Anda diminta untuk memberikan nama untuk agen data Fabric Anda, seperti yang ditunjukkan pada cuplikan layar ini:
Cuplikan layar ini menunjukkan cara memberikan nama pada agen data Fabric.
Lihat cuplikan layar yang disediakan untuk panduan visual tentang penamaan agen data Fabric. Setelah memasukkan nama, lanjutkan dengan konfigurasi untuk menyelaraskan agen data Fabric dengan persyaratan spesifik Anda.
Pilih data Anda
Setelah membuat agen data Fabric, Anda dapat menambahkan hingga lima sumber data - termasuk lakehouse, gudang, model semantik Power BI, database KQL, dan ontologi - dalam kombinasi apa pun (hingga lima total). Misalnya, Anda dapat menambahkan lima model semantik Power BI, atau dua model semantik Power BI, satu lakehouse, dan satu database KQL.
Saat Anda membuat agen data Fabric untuk pertama kalinya, dan memberikan nama, katalog OneLake secara otomatis muncul, memungkinkan Anda menambahkan sumber data. Untuk menambahkan sumber data, pilih sumber data dari katalog seperti yang ditunjukkan pada layar berikutnya, lalu pilih Tambahkan. Setiap sumber data harus ditambahkan satu per satu. Misalnya, Anda dapat menambahkan lakehouse, pilih Tambahkan, lalu tambahkan lagi sumber data lain. Untuk memfilter jenis sumber data, pilih ikon filter lalu pilih jenis yang diinginkan. Anda hanya dapat melihat sumber data dari jenis yang dipilih, sehingga lebih mudah untuk menemukan dan menyambungkan sumber yang sesuai untuk agen data Fabric Anda.
Setelah Anda menambahkan sumber data, Explorer di panel kiri halaman agen data Fabric akan terisi dengan tabel yang tersedia dari setiap sumber data yang dipilih, di mana Anda dapat menggunakan kotak centang untuk menjadikan tabel tersedia atau tidak tersedia untuk AI, seperti yang ditunjukkan pada cuplikan layar berikut:
Nota
Anda hanya memerlukan izin Baca untuk menambahkan model semantik Power BI sebagai sumber data. Izin tulis tidak diperlukan karena agen data Fabric mengeluarkan kueri baca-saja.
Untuk penambahan sumber data berikutnya, navigasikan ke Explorer di panel kiri halaman agen data Fabric, dan pilih + Sumber data, seperti yang diperlihatkan dalam cuplikan layar ini.
Katalog OneLake terbuka lagi, dan Anda dapat dengan mulus menambahkan lebih banyak sumber data sesuai kebutuhan.
Petunjuk / Saran
Pastikan untuk menggunakan nama deskriptif untuk tabel dan kolom. Tabel bernama SalesData lebih bermakna daripada nama TableA, dan kolom seperti ActiveCustomer atau IsCustomerActive lebih jelas daripada C1 atau ActCu. Nama deskriptif membantu AI menghasilkan kueri yang lebih akurat dan andal.
Ajukan pertanyaan
Setelah Anda menambahkan sumber data dan memilih tabel yang relevan untuk setiap sumber data, Anda bisa mulai mengajukan pertanyaan. Sistem menangani pertanyaan seperti yang ditunjukkan dalam cuplikan layar ini:
Pertanyaan yang mirip dengan contoh-contoh ini juga harus berfungsi:
- "Berapa total penjualan kami di California pada tahun 2023?"
- "Apa 5 produk teratas dengan harga daftar tertinggi, dan apa kategorinya?"
- "Apa barang termahal yang belum pernah dijual?"
Pertanyaan seperti ini cocok karena sistem dapat menerjemahkannya ke dalam kueri terstruktur (T-SQL, DAX, atau KQL), menjalankannya terhadap database, lalu mengembalikan jawaban konkret berdasarkan data yang disimpan.
Namun, pertanyaan seperti ini di luar cakupan:
- "Mengapa produktivitas pabrik kami lebih rendah pada Q2 2024?"
- "Apa akar penyebab lonjakan penjualan kami?"
Pertanyaan-pertanyaan ini saat ini berada di luar cakupan karena memerlukan penalaran yang kompleks, analisis korelasi, atau faktor eksternal yang tidak tersedia secara langsung dalam database. Agen data Fabric saat ini tidak melakukan analitik tingkat lanjut, pembelajaran mesin, atau inferensi kausal. Ini hanya mengambil dan memproses data terstruktur berdasarkan kueri pengguna.
Saat Anda mengajukan pertanyaan, agen data Fabric menggunakan Azure OpenAI Assistant API untuk memproses permintaan. Alur beroperasi dengan cara ini:
Akses skema dengan kredensial pengguna
Sistem pertama-tama menggunakan kredensial pengguna untuk mengakses skema sumber data (misalnya, lakehouse, gudang, model semantik PBI, database KQL, atau ontologi). Ini memastikan bahwa sistem mengambil informasi struktur data yang dapat dilihat oleh pengguna yang memiliki izin.
Menyusun prompt
Untuk menafsirkan pertanyaan pengguna, sistem menggabungkan:
- Kueri Pengguna: Pertanyaan bahasa alami yang disediakan oleh pengguna.
- Informasi Skema: Metadata dan detail struktural sumber data yang diambil pada langkah sebelumnya.
- Contoh dan Instruksi: Setiap contoh yang telah ditentukan sebelumnya (misalnya, contoh pertanyaan dan jawaban) atau instruksi spesifik yang diberikan saat menyiapkan agen data Fabric. Contoh dan instruksi ini membantu menyempurnakan pemahaman AI tentang pertanyaan, dan memandu bagaimana AI berinteraksi dengan data.
Semua informasi ini digunakan untuk membuat perintah. Perintah ini berfungsi sebagai input ke Azure OpenAI Assistant API, yang berfungsi sebagai agen yang mendasari agen data Fabric. Ini pada dasarnya menginstruksikan agen data Fabric tentang cara memproses kueri, dan jenis jawaban untuk dihasilkan.
Pemanggilan alat berdasarkan persyaratan kueri
Agen menganalisis perintah yang dibangun, dan memutuskan alat mana yang akan dipanggil untuk mengambil jawaban:
- Natural Language to SQL (NL2SQL): Digunakan untuk menghasilkan kueri SQL ketika data ada di sistem penyimpanan lakehouse atau gudang data.
- Natural Language to DAX (NL2DAX): Digunakan untuk membuat kueri DAX untuk berinteraksi dengan model semantik di sumber data Power BI
- Bahasa Alami ke KQL (NL2KQL): Digunakan untuk membuat kueri KQL untuk mengkueri data dalam database KQL
Alat yang dipilih menghasilkan kueri menggunakan skema, metadata, dan konteks yang disediakan oleh agen yang mendasari agen data Fabric. Kemudian alat memvalidasi kueri, untuk memastikan pemformatan dan kepatuhan yang tepat dengan protokol keamanannya, dan kebijakan AI Bertanggung Jawab (RAI) sendiri.
Pembentukan respons
Agen dasar bagi agen data Fabric menjalankan kueri dan mensyaratkan bahwa respons disusun dan diformat dengan tepat. Agen sering menyertakan konteks tambahan untuk membuat jawaban ramah pengguna. Terakhir, jawabannya ditampilkan kepada pengguna dalam antarmuka percakapan, seperti yang ditunjukkan pada cuplikan layar berikut:
Cuplikan layar menampilkan jawaban dari agen data Fabric untuk pertanyaan.
Agen menyajikan hasil dan langkah-langkah menengah yang diperlukan untuk mengambil jawaban akhir. Pendekatan ini meningkatkan transparansi dan memungkinkan validasi langkah-langkah tersebut, jika perlu. Pengguna dapat memperluas dropdown untuk langkah-langkah untuk melihat semua langkah yang diambil agen data Fabric untuk mengambil jawabannya, seperti yang ditunjukkan pada cuplikan layar berikut:
Selain itu, agen data Fabric menyediakan kode yang dihasilkan yang digunakan untuk mengkueri sumber data yang sesuai, menawarkan wawasan lebih lanjut tentang bagaimana respons dibuat.
Kueri ini dirancang khusus untuk meminta data. Operasi yang melibatkan pembuatan data, pembaruan data, penghapusan data, jenis perubahan data apa pun tidak diizinkan, untuk melindungi integritas data Anda.
Kapan saja, Anda dapat memilih tombol Hapus obrolan untuk menghapus obrolan, seperti yang ditunjukkan pada cuplikan layar berikut:
Fitur Hapus obrolan menghapus semua riwayat obrolan dan memulai sesi baru. Setelah menghapus riwayat obrolan, Anda tidak dapat mengambilnya.
Mengubah sumber data
Untuk menghapus sumber data, arahkan mouse ke atas nama sumber data di Explorer pada jendela sebelah kiri halaman agen data Fabric hingga menu tiga titik muncul. Pilih tiga titik untuk mengungkapkan opsi, lalu pilih Hapus untuk menghapus sumber data seperti yang ditunjukkan pada cuplikan layar berikut:
Atau, jika sumber data Anda berubah, Anda dapat memilih Refresh dalam menu yang sama, seperti yang ditunjukkan pada cuplikan layar berikut:
Ini memastikan bahwa setiap pembaruan sumber data terpantul dan diisi secara tepat di pengeksplor, agar agen data Fabric Anda tetap sinkron dengan data terbaru.
Konfigurasi agen data Fabric
Agen data Fabric menawarkan beberapa opsi konfigurasi yang memungkinkan pengguna menyesuaikan perilaku agen data Fabric, agar lebih sesuai dengan kebutuhan organisasi Anda. Saat agen data Fabric memproses dan menyajikan data, konfigurasi ini menawarkan fleksibilitas yang memungkinkan lebih banyak kontrol atas hasil.
Berikan instruksi
Anda dapat memberikan instruksi khusus untuk memandu perilaku AI. Untuk menambahkannya di panel instruksi agen data Fabric, pilih instruksi agen data seperti yang ditunjukkan pada cuplikan layar berikut:
Di sini, Anda dapat menulis hingga 15.000 karakter dalam teks bahasa Inggris biasa, untuk menginstruksikan AI tentang cara menangani kueri.
Misalnya, Anda dapat menentukan sumber data yang tepat untuk digunakan untuk jenis pertanyaan tertentu. Contoh pilihan sumber data dapat melibatkan mengarahkan AI untuk digunakan
- Model semantik Power BI untuk kueri keuangan
- Lakehouse untuk data penjualan
- database KQL untuk metrik operasional
Instruksi ini memastikan bahwa AI menghasilkan kueri yang sesuai, baik SQL, DAX, atau KQL, berdasarkan panduan Anda dan konteks pertanyaan.
Jika sumber daya AI Anda secara konsisten salah menafsirkan kata, akronim, atau istilah tertentu, Anda dapat mencoba memberikan definisi yang jelas di bagian ini, untuk memastikan bahwa AI memahami dan memprosesnya dengan benar. Ini menjadi sangat berguna untuk terminologi khusus domain atau jargon bisnis yang unik.
Dengan menyesuaikan instruksi ini dan mendefinisikan istilah, Anda meningkatkan kemampuan AI untuk memberikan wawasan yang tepat dan relevan, selaras dengan strategi data dan persyaratan bisnis Anda.
Berikan contoh kueri
Anda dapat meningkatkan akurasi respons dengan memberikan contoh kueri yang disesuaikan dengan setiap sumber data yang didukung (lakehouse, gudang, database KQL). Pendekatan ini, yang dikenal sebagai pembelajaran beberapa bidikan dalam AI generatif, membantu memandu agen data Fabric untuk menghasilkan respons yang lebih selaras dengan harapan Anda.
Saat Anda memberikan sampel pasangan kueri/pertanyaan kepada AI, AI mereferensikan contoh-contoh ini saat menjawab pertanyaan di masa mendatang. Mencocokkan kueri baru dengan contoh yang paling relevan membantu AI menggabungkan logika khusus bisnis, dan merespons pertanyaan umum secara efektif. Fungsionalitas ini memungkinkan penyempurnaan untuk sumber data individual, dan memastikan pembuatan kueri SQL atau KQL yang lebih akurat.
Data model semantik Power BI tidak mendukung penambahan sampel pasangan kueri/pertanyaan saat ini. Namun, untuk sumber data yang didukung seperti lakehouse, gudang, dan database KQL, memberikan lebih banyak contoh dapat secara signifikan meningkatkan kemampuan AI untuk menghasilkan kueri yang tepat ketika performa defaultnya membutuhkan penyesuaian.
Petunjuk / Saran
Serangkaian kueri contoh yang beragam meningkatkan kemampuan agen data Fabric untuk menghasilkan kueri SQL/KQL yang akurat dan relevan.
Untuk menambahkan atau mengedit contoh kueri, pilih tombol Contoh kueri untuk membuka panel kueri contoh, seperti yang diperlihatkan dalam cuplikan layar berikut:
Panel ini menyediakan opsi untuk menambahkan atau mengedit contoh kueri untuk semua sumber data yang didukung kecuali model dan ontologi semantik Power BI. Untuk setiap sumber data, Anda dapat memilih Menambahkan atau Mengedit Contoh Kueri untuk memasukkan contoh yang relevan, seperti yang ditunjukkan pada cuplikan layar berikut:
Nota
Agen data Fabric hanya mengacu pada kueri yang berisi sintaks SQL/KQL yang valid dan yang cocok dengan skema tabel yang dipilih. Agen data Fabric tidak menggunakan kueri yang belum menyelesaikan validasinya. Pastikan bahwa semua contoh kueri valid dan selaras dengan skema untuk memastikan bahwa agen data Fabric menggunakannya secara efektif.
Menerbitkan dan berbagi agen data Fabric
Setelah Anda menguji performa agen data Fabric Anda di berbagai pertanyaan, dan Anda mengonfirmasi bahwa itu menghasilkan kueri SQL, DAX, atau KQL yang akurat, Anda dapat membagikannya dengan kolega Anda. Pada saat itu, pilih Terbitkan, seperti yang ditunjukkan pada cuplikan layar berikut:
Langkah ini membuka jendela yang meminta deskripsi agen data Fabric. Di sini, berikan deskripsi terperinci tentang apa yang dilakukan agen data Fabric. Detail ini memandu kolega Anda tentang fungsionalitas agen data Fabric, dan membantu sistem/orkestrator AI lainnya untuk secara efektif memanggil agen data Fabric.
Setelah menerbitkan agen data Fabric, Anda akan memiliki dua versinya. Satu versi adalah versi draf saat ini, yang dapat Terus Anda perbaiki dan tingkatkan. Versi kedua adalah versi yang diterbitkan, yang dapat Anda bagikan dengan kolega Anda yang ingin meminta agen data Fabric untuk mendapatkan jawaban atas pertanyaan mereka. Anda dapat memasukkan umpan balik dari kolega Anda ke dalam versi draf Anda saat ini saat mengembangkannya, untuk lebih meningkatkan performa agen data Fabric.