Microsoft Fabric 中的 Data agent 是一項新的 Microsoft Fabric 功能,讓你能利用生成式 AI 建立自己的對話式問答系統。 網狀架構資料代理程式可讓組織中的每個人更容易存取資料見解且更可採取動作。 使用 Fabric 資料代理程式,您的團隊可以使用簡單的英語問題對話,以便查詢組織儲存在 Fabric OneLake 中的資料,並獲得相關答案。 如此一來,即使是沒有 AI 技術專長或不熟悉資料結構的人,也可以獲得精確且內容豐富的答案。
您也可以新增組織特定的指示、範例和指引,以微調網狀架構資料代理程式。 此方法確保回應符合組織的需求與目標,讓每個人都能更有效地參與數據。 網狀架構資料代理程式會促進資料驅動決策的文化特性,因為它會降低見解輔助功能的障礙,有助於共同作業,並協助貴組織從其資料中擷取更多價值。
這很重要
這項功能處於預覽狀態。
先決條件
- 付費 F2 或更高的 Microsoft Fabric 容量,或啟用 Microsoft Fabric 的 每份容量的 Power BI Premium(P1 或更高)容量
- 已啟用 Fabric 資料代理租戶設定。
- 已啟用 AI 的跨地理位置處理。
- 已啟用 AI 的跨地理位置儲存。
- 至少要有一種,且有資料:倉庫、湖屋、一個或多個 Power BI 語意模型、KQL 資料庫,或本體論。
- Power BI 語義模型透過 XMLA 端點租用戶切換 啟用於 Power BI 語義模型數據來源。
網狀架構資料代理程式的運作方式
Fabric 資料代理使用大型語言模型(LLM)幫助使用者自然地與資料互動。 Fabric 資料代理套用 Azure OpenAI 助理 API,行為類似代理。 它會處理使用者問題,決定最相關的資料來源(Lakehouse、Warehouse、Power BI 資料集、KQL 資料庫、本體論),並呼叫適當的工具來產生、驗證及執行查詢。 然後,使用者可以用純語言詢問問題,並接收結構化、人類可讀取的答案,而不需要撰寫複雜的查詢,並確保正確且安全的資料存取。
以下是其運作方式:
問題解析與驗證:Fabric 資料代理將 Azure OpenAI Assistant API 作為底層代理來處理使用者問題。 此方法可確保問題符合安全性通訊協定、負責任的 AI (RAI) 原則和使用者權限。 網狀架構資料代理程式會嚴格強制執行唯讀存取權,維護所有資料來源的唯讀資料連線。
資料來源識別:Fabric 資料代理利用使用者的憑證存取資料來源的結構。 此方法確保系統取得使用者有權限查看的資料結構資訊。 接著,它會將使用者的問題與所有可用資料來源(包括關聯式資料庫(Lakehouse 和 Warehouse)、Power BI 資料集(語意模型)、KQL 資料庫以及本體論進行評估。 它也可能會參考使用者提供的資料代理程式指示,以判斷最相關的資料來源。
工具呼叫與查詢產生:一旦確認正確的資料來源,Fabric 資料代理會重新表述問題以提升清晰度與結構,然後呼叫相應工具產生結構化查詢:
- 關聯式資料庫 (Lakehouse/Warehouse) 的自然語言轉為 SQL (NL2SQL)。
- Power BI 資料集(語意模型)的自然語言轉換為 DAX (NL2DAX)。
- 將自然語言轉換為 KQL (NL2KQL) 用於 KQL 資料庫。
選定的工具會根據提供的架構、中繼資料以及網狀架構資料代理程式中的代理傳遞的上下文產生查詢。
查詢驗證:工具執行驗證以確保查詢正確形成,並遵守自身的安全協定與 RAI 政策。
查詢執行與回應:驗證後,Fabric 資料代理會針對所選資料來源執行查詢。 結果會格式化為人類可讀取的回應,其中可能包含結構化資料,例如資料表、摘要或重要見解。
此方法可確保使用者可以使用自然語言與其資料互動,而網狀架構資料代理程式會處理查詢產生、驗證和執行的複雜性,而不需要使用者自行撰寫 SQL、DAX 或 KQL。
網狀架構資料代理程式設定
設定網狀架構資料代理程式類似於建置 Power BI 報表:您一開始先設計和調整報表,以確保它符合您的需求,然後發佈並與同事共用,以便他們能夠與資料互動。 設定網狀架構資料代理程式牽涉到:
選擇資料來源:Fabric 資料代理可任意組合支援最多五個資料來源,包括湖屋、倉庫、KQL 資料庫、Power BI 語意模型及本體。 例如,已設定的網狀架構資料代理程式可能包含五個 Power BI 語意模型。 它可以包含兩個 Power BI 語意模型、一個資料湖存放庫和一個 KQL 資料庫的組合。 您有許多可用的選項。
選擇相關資料表:選擇資料來源後,逐一新增,並定義 Fabric 資料代理所使用的每個來源的具體資料表。 此步驟可確保網狀架構資料代理程式只專注於相關資料,以擷取精確的結果。
新增情境:為提升 Fabric 資料代理的準確性,請透過 Fabric 資料代理指令與範例查詢提供更多情境。 作為網狀架構資料代理程式的基礎代理程式,內容可協助 Azure OpenAI 助理 API 做出更明智的決策,以瞭解如何處理使用者問題,並判斷哪一個資料來源最適合回答它們。
資料代理指令:新增指令,指導支撐 Fabric 資料代理的代理,判斷最適合回答特定問題的資料來源。 您也可以提供自訂規則或定義,以釐清組織術語或特定需求。 這些指示可以提供更多內容或喜好設定,以影響代理程式選取和查詢資料來源的方式。
- 將財務計量相關問題導向至 Power BI 語意模型。
- 將涉及原始資料探索的查詢指派給 Lakehouse。
- 將需要日誌分析的問題轉送至 KQL 資料庫。
範例查詢:加入範例問題-查詢對,說明 Fabric 資料代理應如何回應常見查詢。 這些範例可作為代理程式的指南,可協助其瞭解如何解譯類似問題並產生精確的回應。
備註
Power BI 語意模型數據源目前不支援新增範例查詢/問題組。
藉由結合清楚的 AI 指示和相關範例查詢,您可以更妥善地配合 Fabric 數據代理程式與組織的數據需求,確保更精確且內容感知的回應。
Fabric 資料代理程式與 Copilot 之間的差異
雖然 Fabric 資料代理與 Fabric 共同駕駛皆使用生成式 AI 來處理與推理資料,但它們在功能與使用情境上存在關鍵差異:
配置彈性:你可以高度配置 Fabric 資料代理。 您可以提供自訂指示和範例,以針對特定案例量身打造其行為。 另一方面,Fabric Copilot 是預先配置的,沒有這種程度的客製化。
範圍與使用案例:Fabric 副駕駛協助 Microsoft Fabric 內的任務,如產生筆記本程式碼或倉儲查詢。 布式資料代理程式則是獨立的元件。 若要讓網狀架構資料代理程式更適用於更廣泛的使用案例,它們可與外部系統整合,例如 Microsoft Copilot Studio、Azure AI Foundry、Microsoft Teams 或其他 Fabric 外部工具。
網狀架構資料代理程式的評估
產品團隊嚴格評估了 Fabric 資料代理回應的品質與安全性:
基準測試:產品小組測試了各種公用和私人資料集的網狀架構資料代理程式,以確保高品質且準確的回應。
強化傷害緩解措施:產品團隊實施防護措施,確保 Fabric 資料代理的輸出聚焦於特定資料來源的情境,降低不相關或誤導性答案的風險。
局限性
Fabric 資料代理目前處於公開預覽階段,並有其限制。 更新會隨著時間改善網狀架構資料代理程式。
- Fabric 資料代理程式僅產生 SQL、DAX 和 KQL 的「讀取」查詢。 它不會產生 SQL、DAX 或 KQL 查詢來建立、更新或刪除資料。
- Fabric 資料代理不支援非結構化資料,例如 .pdf、.docx或 .txt 檔案。 您無法使用網狀架構資料代理程式來存取非結構化資料資源。
- Fabric 資料代理目前不支援非英語語言。 為了達到最佳表現,請以英文提供問題、指示和範例查詢。
- 您無法變更網狀架構資料代理程式所使用的 LLM。
- Fabric 資料代理中的對話紀錄不一定總是持續存在。 在某些情況下,例如後端基礎設施變更、服務更新或模型升級,過去的對話紀錄可能會被重置或遺失。