共用方式為


網狀架構資料代理程式概念(預覽)

Microsoft Fabric 中的資料代理程式是新的 Microsoft Fabric 功能,可讓您使用生成式 AI 建置自己的交談式問答系統。 網狀架構資料代理程式可讓組織中的每個人更容易存取資料見解且更可採取動作。 使用 Fabric 資料代理程式,您的團隊可以使用簡單的英語問題對話,以便查詢組織儲存在 Fabric OneLake 中的資料,並獲得相關答案。 如此一來,即使是沒有 AI 技術專長或不熟悉資料結構的人,也可以獲得精確且內容豐富的答案。

您也可以新增組織特定的指示、範例和指引,以微調網狀架構資料代理程式。 這可確保回應符合貴組織的需求和目標,讓每個人都能更有效率地與資料互動。 網狀架構資料代理程式會促進資料驅動決策的文化特性,因為它會降低見解輔助功能的障礙,有助於共同作業,並協助貴組織從其資料中擷取更多價值。

這很重要

這項功能處於預覽狀態。

先決條件

網狀架構資料代理程式的運作方式

網狀架構資料代理程式會使用大型語言模型 (LLM) 來協助使用者自然地與其資料互動。 網狀架構資料代理程式會套用 Azure OpenAI Assistant API,其行為就像代理程式一樣。 它會處理使用者問題、判斷最相關的資料來源(Lakehouse、Warehouse、Power BI 資料集、KQL 資料庫),並叫用適當的工具來產生、驗證和執行查詢。 然後,使用者可以用純語言詢問問題,並接收結構化、人類可讀取的答案,而不需要撰寫複雜的查詢,並確保正確且安全的資料存取。

以下是其運作方式:

問題剖析和驗證:網狀架構資料代理程式會將 Azure OpenAI Assistant API 套用為基礎代理程式來處理使用者問題。 此方法可確保問題符合安全性通訊協定、負責任的 AI (RAI) 原則和使用者權限。 網狀架構資料代理程式會嚴格強制執行唯讀存取權,維護所有資料來源的唯讀資料連線。

資料來源識別:網狀架構資料代理程式會使用使用者的認證來存取資料來源的架構。 這可確保系統擷取使用者有權檢視的數據結構資訊。 然後,它會針對所有可用的資料來源評估使用者的問題,包括關聯資料庫(Lakehouse 和 Warehouse)、Power BI 資料集(語意模型)和 KQL 資料庫。 它也可能會參考使用者提供的資料代理程式指示,以判斷最相關的資料來源。

工具叫用和查詢產生:一旦識別出正確的資料來源,網狀架構資料代理程式會針對清楚和結構重新描述問題,然後叫用對應的工具來產生結構化查詢:

  • 關聯式資料庫 (Lakehouse/Warehouse) 的自然語言轉為 SQL (NL2SQL)。
  • Power BI 資料集(語意模型)的自然語言轉換為 DAX (NL2DAX)。
  • 將自然語言轉換為 KQL (NL2KQL) 用於 KQL 資料庫。

選定的工具會根據提供的架構、中繼資料以及網狀架構資料代理程式中的代理傳遞的上下文產生查詢。

查詢驗證:此工具會執行驗證,以確保查詢的格式正確,並遵守自己的安全性通訊協定和 RAI 原則。

查詢執行和回應:驗證之後,網狀架構資料代理程式會針對所選資料源執行查詢。 結果會格式化為人類可讀取的回應,其中可能包含結構化資料,例如資料表、摘要或重要見解。

此方法可確保使用者可以使用自然語言與其資料互動,而網狀架構資料代理程式會處理查詢產生、驗證和執行的複雜性,而不需要使用者自行撰寫 SQL、DAX 或 KQL。

網狀架構資料代理程式設定

設定網狀架構資料代理程式類似於建置 Power BI 報表:您一開始先設計和調整報表,以確保它符合您的需求,然後發佈並與同事共用,以便他們能夠與資料互動。 設定網狀架構資料代理程式牽涉到:

選取資料來源:網狀架構資料代理程式支援任意組合的最多五個資料來源,包括資料湖存放庫、倉儲、KQL 資料庫和 Power BI 語意模型。 例如,已設定的網狀架構資料代理程式可能包含五個 Power BI 語意模型。 它可以包含兩個 Power BI 語意模型、一個資料湖存放庫和一個 KQL 資料庫的組合。 您有許多可用的選項。

選擇相關資料表:選取資料來源之後,您必須一次新增一個,並定義網狀架構資料代理程式將使用之每個來源的特定資料表。 此步驟可確保網狀架構資料代理程式只專注於相關資料,以擷取精確的結果。

新增內容:若要改善網狀架構資料代理程式精確度,您可以透過網狀架構資料代理程式指示和範例查詢來提供更多內容。 作為網狀架構資料代理程式的基礎代理程式,內容可協助 Azure OpenAI 助理 API 做出更明智的決策,以瞭解如何處理使用者問題,並判斷哪一個資料來源最適合回答它們。

  • 資料代理程式指示:您可以新增指示,以引導在網狀架構資料代理程式下運作的代理程式,以判斷最佳資料來源來回答特定類型的問題。 您也可以提供自訂規則或定義,以釐清組織術語或特定需求。 這些指示可以提供更多內容或喜好設定,以影響代理程式選取和查詢資料來源的方式。

    • 財務計量相關問題導向至 Power BI 語意模型。
    • 將涉及原始資料探索的查詢指派給 Lakehouse。
    • 將需要日誌分析的問題轉送至 KQL 資料庫。
  • 範例查詢:您可以新增範例問題查詢組,以說明網狀架構資料代理程式應該如何回應常見的查詢。 這些範例可作為代理程式的指南,可協助其瞭解如何解譯類似問題並產生精確的回應。

備註

Power BI 語意模型數據源目前不支援新增範例查詢/問題組。

藉由結合清楚的 AI 指示和相關範例查詢,您可以更妥善地配合 Fabric 數據代理程式與組織的數據需求,確保更精確且內容感知的回應。

Fabric 資料代理程式與 Copilot 之間的差異

雖然網狀架構資料代理程式和網狀架構 Copilot 都使用生成式 AI 來處理和推理資料,但其功能和使用案例有主要差異:

設定彈性:網狀架構資料代理程式可高度設定。 您可以提供自訂指示和範例,以針對特定案例量身打造其行為。 另一方面,Fabric 共乘程式已預先配置,且不提供此程度的自訂選項。

範圍和使用案例:網狀架構 Copilot 的設計目的是協助 Microsoft Fabric 內的工作,例如產生筆記本程式碼或倉儲查詢。 布式資料代理程式則是獨立的元件。 若要讓網狀架構資料代理程式更適用於更廣泛的使用案例,它們可與外部系統整合,例如 Microsoft Copilot Studio、Azure AI Foundry、Microsoft Teams 或其他 Fabric 外部工具。

網狀架構資料代理程式的評估

網狀架構資料代理程式回應的品質和安全性經過嚴格的評估:

基準測試:產品小組測試了各種公用和私人資料集的網狀架構資料代理程式,以確保高品質且準確的回應。

增強的危害風險降低:已具備更多防護措施,以確保網狀架構資料代理程式輸出仍著重於所選資料來源的內容,以降低無關或誤導性答案的風險。

局限性

網狀架構資料代理程式目前處於公開預覽狀態,但有限制。 更新會隨著時間改善網狀架構資料代理程式。

  • 網狀架構資料代理程式可以針對涉及事實、總計、排名或篩選的問題產生結構化查詢(SQL、DAX 或 KQL)來擷取資料。 不過,它無法解譯趨勢、提供說明或分析根本原因。
  • 網狀架構資料代理程式只會產生 SQL/DAX/KQL「讀取」查詢。 它不會產生建立、更新或刪除資料的 SQL/DAX/KQL 查詢。
  • 網狀架構資料代理程式只能存取您提供的資料。 它只會使用您提供的資料資源組態。
  • 網狀架構資料代理擁有與與其互動使用者相同的資料存取許可權。 當網狀架構資料代理程式發佈至其他位置,例如,Microsoft Copilot Studio、Azure AI Foundry 和 Microsoft Teams 時,這是真實情況。
  • 您無法將五個以上的資料來源新增至網狀架構資料代理程式。
  • 您無法使用網狀架構資料代理程式來存取非結構化資料資源。 例如,這些資源包括.pdf、.docx 或 .txt 檔案。
  • 網狀架構資料代理程式會封鎖非英文語言的問題或指示。
  • 您無法變更網狀架構資料代理程式所使用的 LLM。
  • 如果 KQL 資料庫有超過 1,000 個資料表或任何超過 100 個資料行的資料表,您就無法將 KQL 資料庫新增為資料來源。
  • 如果 Power BI 語意模型包含總計超過 100 個資料行和量值,則無法將 Power BI 語意模型新增為資料來源。
  • Fabric 資料代理程式在所有資料來源中,選取的資料表數目最適宜為 25 個或更少。
  • 非描述性資料來源資料行和資料表名稱會對產生的 SQL/DAX/KQL 查詢品質產生顯著的負面影響。 我們建議使用描述性名稱。
  • 使用太多資料行和資料表可能會降低網狀架構資料代理程式效能。
  • 網狀架構資料代理程式目前設計用來處理簡單的查詢。 需要許多聯結或複雜邏輯的複雜查詢通常具有較低的可靠性。
  • 如果您將 Power BI 語意模型新增為資料來源,網狀架構資料代理程式不會使用任何隱藏的資料表、資料行或量值。
  • 如果您先前已建立使用倉儲做為資料來源的網狀架構資料代理程式,且該倉儲位於未裝載該網狀架構資料代理程式的工作區中,您可能會遇到錯誤。 若要解決此問題,請刪除現有的資料來源,然後再次新增它。
  • 若要將 Power BI 語意模型新增為網狀架構資料代理程式的資料來源,您需要該 Power BI 語意模型的讀取/寫入許可權。 查詢使用 Power BI 語意模型的網狀架構資料代理程式,也需要您具有基礎 Power BI 語意模型的讀取/寫入許可權。
  • 網狀架構資料代理程式可能會傳回不正確的答案。 您應該與同事測試網狀架構資料代理程式,以確認其是否如預期地回答問題。 如果犯錯,請提供更多範例和指示。
  • 如果您先前已建立並發佈網狀架構資料代理程式,而且您已經以程式設計方式使用其 URL,則如果您在網狀架構資料代理程式新的使用者介面頁面中開啟網狀架構資料代理程式,該 URL 將無法再運作。 若要解決此問題,您必須重新發佈網狀架構資料代理程式,並根據 Assistants API 使用新的 URL。