koncepty datového agenta Fabric

Datový agent v Microsoft Fabric je obecně dostupná funkce, která umožňuje vytvářet vlastní konverzační systémy otázek a odpovědí využívající generativní AI. Datový agent Fabric zpřístupňuje přehledy dat pro všechny uživatele ve vaší organizaci a usnadňuje akční kroky na základě datových přehledů. Pomocí agenta pro data ve Fabricu může váš tým s pomocí prostých otázek v angličtině vést konverzace o datech uložených vaší organizací v rámci Fabric OneLake a obdržet relevantní odpovědi. Díky tomu můžou přesné a kontextové odpovědi získat i lidé bez technických odborných znalostí a umělé inteligence nebo hluboké porozumění datové struktuře. V širších architekturách agentních aplikací na Microsoft Fabric slouží datoví agenti jako součást konverzačních analytik, připojují se k řízeným datům v OneLake pomocí lakehouses, skladišť, sémantických modelů a KQL databází v řešeních s více agenty.

Můžete také přidat pokyny specifické pro organizaci, příklady a pokyny k vyladění Fabric datového agenta. Tento přístup zajišťuje, aby odpovědi odpovídaly potřebám a cílům vaší organizace, což všem umožňuje efektivnější zapojení dat. Fabric datový agent podporuje kulturu rozhodování řízeného daty, protože snižuje překážky v oblasti přístupnosti, usnadňuje spolupráci a pomáhá vaší organizaci extrahovat z dat větší hodnotu.

Požadavky

Požadavky zásad správného řízení

Pokud se váš tenant nebo pracovní prostor řídí zásadami Microsoft Purview, musí agenti fungovat v rámci těchto zásad. Následující zásady Purview můžou na základě konfigurace citlivosti a zásad omezit přístup agentů a výsledky, které agenti vrátí:

  • Zásady DLP v Fabric Data Warehouse (obecně dostupné): Zásady DLP můžou detekovat a omezit přístup k citlivým datům v aktivech skladu, které agent zpracovává.
  • Zásady omezení přístupu (Preview) pro Fabric KQL databázi, Fabric SQL databázi a Fabric Data Warehouse: Tyto zásady mohou zabránit agentovi v přístupu k prostředkům klasifikovaným jako citlivé nebo zabránit vrácení výsledků z těchto prostředků.

Jak funguje agent dat Fabric

Datový agent Fabric používá velké jazykové modely (LLM), které uživatelům pomáhají přirozeně pracovat se svými daty. Datový agent Fabric používá rozhraní API Azure OpenAI Assistant a chová se jako agent. Zpracovává dotazy uživatelů, určuje nejrelevantnější zdroj dat (Lakehouse, Warehouse, Power BI datovou sadu, databáze KQL, ontologie nebo Microsoft Graph) a vyvolá příslušný nástroj pro generování, ověření a spouštění dotazů. Uživatelé pak můžou klást otázky ve formátu prostého jazyka a přijímat strukturované odpovědi čitelné pro člověka. Tento přístup eliminuje potřebu psát složité dotazy a zajišťuje přesný a zabezpečený přístup k datům.

Tady je postup, jak funguje podrobně:

Parsování a validace dotazů: Agent dat Fabric používá API pomocníka Azure OpenAI jako podkladového agenta ke zpracování uživatelských dotazů. Tento přístup zajišťuje, že otázka splňuje protokoly zabezpečení, zodpovědné zásady AI (RAI) a uživatelská oprávnění. Agent Fabric také respektuje kontroly správy Microsoft Purview aplikované na podkladové datové zdroje Fabric, včetně zásad ochrany před únikem informací (DLP) a zásad omezení přístupu. Vynucování zásad může zabránit tomu, aby se určité dotazy spouštěly nebo se v odpovědích zobrazovaly konkrétní data. Datový agent Fabric striktně vynucuje přístup jen pro čtení a udržuje datová připojení jen pro čtení ke všem zdrojům dat.

Mechanismy vynucení: Datový agent Fabric používá během zpracování několik vrstev ochrany. Pomocí přihlašovacích údajů a oprávnění žádajícího uživatele vynucuje přístup s nejnižšími oprávněními a zajišťuje, aby každá interakce dosáhla jenom dat, ke kterým má uživatel oprávnění k zobrazení. Agent vyhodnocuje požadavky vůči zásadám tenanta a pracovního prostoru před provedením jakékoliv akce. Ochranné mechanismy omezují vyvolání nástroje a výstupy na vymezené zdroje dat a brání tomu, aby dotazy dosáhly prostředků mimo nakonfigurovaný obor. Volitelně můžete integrovat Bezpečnost obsahu Azure AI a použít kontroly rizik obsahu, které pomáhají omezit škodlivé nebo zastaralé reakce.

Identifikací zdroje dat: Datový agent Fabric používá pro přístup ke schématu zdroje dat přihlašovací údaje uživatele. Tento přístup zajišťuje, že systém načte informace o datové struktuře, které má uživatel oprávnění k zobrazení. Agent pak vyhodnotí otázku uživatele vůči všem dostupným zdrojům dat, včetně relačních databází (Lakehouse a Warehouse), datových sad Power BI (sémantické modely), databází KQL, ontologií a Microsoft Graph. Může také odkazovat na pokyny uživatelského agenta pro určení nejrelevavantnějšího zdroje dat. U sémantických modelů Power BI agent využívá uživatelovo oprávnění ke čtení modelu k načtení schématu a metadat pro generování dotazů; pro dotazy prováděné agentem se nevyžaduje oprávnění k sestavení.

Nástroj vyvolání a generování dotazů: Jakmile zjistíte správný zdroj dat nebo zdroje, Fabric agent dat přehraje otázku pro srozumitelnost a strukturu a potom vyvolá odpovídající nástroj pro vygenerování strukturovaného dotazu:

  • Přirozený jazyk SQL (NL2SQL) pro relační databáze (Lakehouse/Warehouse).
  • Přirozený jazyk DAX (NL2DAX) pro datové sady Power BI (sémantické modely).
  • Převod přirozeného jazyka do KQL (NL2KQL) pro databáze KQL. NL2KQL může používat uživatelem definované funkce KQL (UDF), pokud jsou dostupné ve vybraných databázích.
  • Microsoft Graph dotazy na data organizace přístupné prostřednictvím Microsoft Graph.

Vybraný nástroj vygeneruje dotaz na základě zadaného schématu, metadat a kontextu, který agent podkladuje Fabric datového agenta, a pak předá.

Ověření dotazu: Nástroj provádí ověření, aby se zajistilo, že je dotaz správně vytvořený a dodržuje vlastní protokoly zabezpečení a zásady RAI.

Dotaz a odpověď: Po ověření spustí agent dat Fabric dotaz na vybraný zdroj dat. Výsledky jsou naformátované do odpovědi čitelné člověkem, která může zahrnovat strukturovaná data, jako jsou tabulky, souhrny nebo klíčové přehledy.

Pomocí tohoto přístupu můžou uživatelé pracovat se svými daty pomocí přirozeného jazyka. Datový agent Fabric zpracovává složitost generování, ověřování a spouštění dotazů. Uživatelé nemusí sami psát SQL, DAX ani KQL.

Zabezpečení a zásady správného řízení s využitím Microsoft Purview

Microsoft Purview poskytuje správu a řízení rizik pro datové agenty 'Fabric'. Tyto funkce jsou aktuálně ve verzi Preview a pomáhají organizacím udržovat dodržování předpisů při používání agentů pro přístup k datům Fabric. Mezi klíčové funkce patří:

  • Detekce rizik a auditování: Výzvy a odpovědi od datových agentů Fabric mohou být podrobeny detekci rizik a auditování pomocí Purview, což dává bezpečnostním týmům přehled o tom, jak agenti zpracovávají data organizace.
  • Posouzení rizik dat DSPM: Posouzení rizik v oblasti stavu zabezpečení dat (DSPM) můžou odhalit citlivá data ve zdrojích dat, které používají agenti, a pomáhá identifikovat a řešit potenciální vystavení.
  • Insider Risk Management: Purview Insider Risk Management dokáže detekovat rizikové vzorce použití umělé inteligence zahrnující agenty, jako jsou neobvyklé objemy dotazů nebo přístup k citlivým datům.
  • Audit, eDiscovery a zásady uchovávání informací: Zásady auditování, eDiscovery a uchovávání informací v rámci Purview se vztahují na interakce a výstupy agentů v podporovaných úlohách Fabric. Detekce nedodržování předpisů v používání může také označit aktivitu agenta, která porušuje zásady organizace.

Další informace o tom, jak se Microsoft Purview integruje s Fabric, najdete v tématu Použití Microsoft Purview k řízení Microsoft Fabric.

konfigurace datového agenta Fabric

Konfigurace Fabric datového agenta se podobá vytvoření sestavy Power BI – začnete tím, že ji navrhnete a zpřesníte, abyste zajistili, že vyhovuje vašim potřebám, a pak ji publikujete a sdílíte s kolegy, aby mohli s daty pracovat. Nastavení Fabric datového agenta zahrnuje:

Výběr zdrojů dat: Datový agent Fabric podporuje až pět zdrojů dat v libovolné kombinaci, včetně jezer, skladů, databází KQL, Power BI sémantických modelů, ontologií a Microsoft Graph. Například nakonfigurovaný datový agent Fabric může obsahovat pět Power BI sémantických modelů. Může obsahovat kombinaci dvou Power BI sémantických modelů, jednoho jezera a jedné databáze KQL. Máte mnoho dostupných možností.

Volba relevantních tabulek: Po výběru zdrojů dat je přidejte po jednom a definujte konkrétní tabulky z každého zdroje, který Fabric agent dat používá. Tento krok zajistí, že Fabric datový agent načte přesné výsledky tím, že se zaměří jenom na relevantní data. Tento krok znamená výběr tabulek lakehouse (nikoli jednotlivých souborů lakehouse). Pokud vaše data začínají jako soubory (například CSV nebo JSON), zpřístupněte je agentům tak, že je ingestuje do tabulek nebo je jinak zpřístupní prostřednictvím tabulek.

Adding Context: Pokud chcete zlepšit přesnost datového agenta Fabric, poskytněte další kontext prostřednictvím pokynů k datovému agentovi Fabric a ukázkových dotazů. Jako podkladový agent pro Fabric datového agenta pomáhá kontext Azure rozhraní API Pomocníka pro OpenAI provádět informovanější rozhodnutí o zpracování otázek uživatelů a určit, který zdroj dat je nejvhodnější k jejich zodpovězení.

  • Pokyny pro agenta Data: Přidejte pokyny, které provedou agenta, který je základem datového agenta Fabric, k určení nejlepšího zdroje dat pro zodpovídání konkrétních typů otázek. Můžete také zadat vlastní pravidla nebo definice, které objasňují terminologii organizace nebo konkrétní požadavky. Tyto pokyny můžou poskytnout více kontextu nebo předvoleb, které ovlivňují, jak agent vybírá a dotazuje zdroje dat. Například přímé dotazy týkající se finančních metrik směrujte do sémantického modelu Power BI, dotazy zahrnující průzkum hrubých dat přiřaďte do lakehouse a dotazy vyžadující logovou analýzu odešlete do databáze KQL.

  • Ukázkové dotazy: Přidejte ukázkové dvojice otázek a dotazů, které ilustrují, jak by měl datový agent Fabric reagovat na běžné dotazy. Tyto příklady slouží jako průvodce pro agenta, který pomáhá pochopit, jak interpretovat podobné otázky a generovat přesné odpovědi.

Poznámka:

Přidání ukázkových párů dotazů se v současné době nepodporuje pro sémantické modely zdrojů dat Power BI.

Kombinací jasných instrukcí umělé inteligence a relevantních ukázkových dotazů můžete lépe sladit Fabric datového agenta s potřebami dat vaší organizace a zajistit přesnější a kontextové odpovědi.

Důležité

Pokyny pro datového agenta poskytované vývojářem a ukázkové dotazy musí fungovat v rámci omezení na základě rolí a organizace. Pokud jsou pokyny nebo výzvy v konfliktu se zásadami (například se pokusí obejít chování jen pro čtení nebo získat přístup ke zdrojům mimo rozsah), agent odmítne nebo přesměruje požadavek podle modelu priority popsaného v následující části.

Vrstvy zásad správného řízení a záměru

Při konfiguraci Fabric datového agenta může mít několik vrstev záměru vliv na chování agenta. Tyto vrstvy, které jsou uvedené od nejvyšších po nejnižší prioritu, definují, co může agent dělat:

  1. Záměr organizace: Zásady a požadavky na dodržování předpisů na úrovni tenanta nastavené správci vaší organizace Tato omezení mají nejvyšší prioritu a nelze je přepsat žádnou jinou vrstvou.
  2. Záměr založený na rolích: Nastavení zásad správného řízení pracovního prostoru a hranice oprávnění, které se vztahují na konkrétní role nebo skupiny. Tato nastavení vynucují řízení přístupu a omezení rozsahu dat.
  3. Záměr vývojáře: Vlastní pokyny, ukázkové dotazy a konfigurace zdrojů dat, které zadáte při sestavování datového agenta.
  4. Záměr uživatele: Dotazy a výzvy, které koncoví uživatelé odesílali během konverzací s agentem.

Když dojde ke konfliktům mezi vrstvami, vrstvy s vyšší prioritou přepíší nižší vrstvy. Například zásady organizace a nastavení zásad správného řízení pracovního prostoru vždy přepisují pokyny pro vývojáře a výzvy uživatelů. Tento model priority zajišťuje, aby agent fungoval v rámci schválených hranic bez ohledu na to, jak je nakonfigurovaný nebo vyzváný.

Rozdíl mezi Fabric datovým agentem a copilotem

I když Fabric datoví agenti a Fabric copiloty používají generativní umělou inteligenci ke zpracování a analýze dat, v jejich funkcích a případech použití existují klíčové rozdíly:

Flexibilita konfigurace: Můžete vysoce konfigurovat Fabric datové agenty. Můžete zadat vlastní pokyny a příklady pro přizpůsobení jejich chování konkrétním scénářům. Fabric kopiloti jsou na druhou stranu předem nakonfigurovaní a nenabízejí tuto úroveň přizpůsobení.

Scope and use case: Fabric copilots pomáhá s úlohami v rámci Microsoft Fabric, jako je generování kódu poznámkového bloku nebo dotazů na sklad. Datoví agenti Fabric jsou naopak samostatné konfigurovatelné artefakty, které mohou provádět dotazy nad daty napříč OneLake a sémantickými modely. Datoví agenti Fabric se také dají integrovat s Microsoft 365 Copilot, aby mohli poskytnout přehledy ve formě přirozeného jazyka přímo v aplikacích Microsoft 365. Když jsou agenti přístupní prostřednictvím Microsoft 365 Copilot, zásady zásad správného řízení Microsoft Purview se stále vztahují na podkladové zdroje dat. Kromě toho se Fabric datové agenty můžou připojit k externím systémům, jako jsou Microsoft Copilot Studio, Azure AI Foundry, Microsoft Teams nebo jiné nástroje mimo Fabric. Externí orchestrátory a runtimy s více agenty mohou vyvolat datové agenty v rámci Fabricu pro podporu end-to-end agentních pracovních toků, zatímco datoví agenti zůstávají zaměřeni na přístup k datům pouze pro čtení a dodržují řízený přístup k datům.

Vyhodnocení datového agenta Fabric

Produktový tým pečlivě vyhodnotil bezpečnost a kvalitu odpovědí agenta dat Fabric.

Benchmark Testing: Produktový tým testoval datové agenty Fabric napříč celou řadou veřejných a privátních datových sad, aby zajistil vysoce kvalitní a přesné odpovědi.

Enhanced Harm Mitigations: Produktový tým implementoval bezpečnostní opatření, aby se zajistilo, že výstupy datového agenta Fabric zůstanou zaměřené na kontext vybraných zdrojů dat, což snižuje riziko irelevantních nebo zavádějících odpovědí.

Zásady správného řízení a zabezpečení

integrace Microsoft Purview poskytuje ovládací prvky zásad správného řízení pro datové agenty Fabric. Při konfiguraci datového agenta se zásady správného řízení Purview vztahují na podkladové zdroje dat, ke které má agent přístup. Tato integrace pomáhá zajistit, aby přístup k datům prostřednictvím agentů dodržoval stejná pravidla dodržování předpisů a klasifikace jako přímý přístup.

Microsoft Purview zásady: Zásady Purview, jako jsou řízení přístupu k datům a popisky citlivosti, platí pro zdroje dat, které agenti dotazuje. Pokud zásady Purview omezují přístup k jezeru nebo skladu, agent toto omezení respektuje při zpracování uživatelských dotazů.

Ochrana odchozího přístupu: Agentury fabric dat operují v rámci ochrany odchozího přístupu pracovního prostoru. Správci pracovního prostoru můžou spravovat povolená odchozí připojení prostřednictvím nastavení pracovního prostoru a řídit, ke kterým externím koncovým bodům může datový agent přistupovat.

integrace Microsoft 365 Copilot: Při zobrazení datových agentů Fabric prostřednictvím Microsoft 365 Copilot zásady správného řízení Purview nadále platí. Uživatelé mají přístup jenom k datům, která jejich přihlašovací údaje a zásady Purview povolují bez ohledu na vstupní bod.

ALM a DevOps pro datové agenty

Fabric agenti dat podporují možnosti správy životního cyklu aplikací (ALM), které pomáhají spravovat konfigurace agentů napříč vývojovými, testovacími a produkčními prostředími.

Diagnostika: Pomocí integrované diagnostiky můžete monitorovat chování agenta, identifikovat problémy s generováním dotazů a řešit potíže s kvalitou odpovědí. Diagnostika poskytuje přehled o tom, jak agent zpracovává otázky a vybírá zdroje dat.

Integrace Git: Konfigurace agenta můžete spravovat verzemi pomocí integrace Git. Připojte pracovní prostor Fabric k úložišti Git a sledujte změny pokynů agenta, ukázkové dotazy a výběry zdrojů dat v průběhu času.

KanályDeployment: Kanály nasazení Fabric slouží k propagaci datových agentů napříč pracovními prostory (například z vývoje do produkčního prostředí). Tato podpora umožňuje otestovat změny v přípravném prostředí, než je zpřístupní koncovým uživatelům.

Provozní dohled

Pokud chcete zachovat průběžnou kvalitu a sladění zásad, zvažte tyto provozní postupy pro vašeho Fabric datového agenta:

  • Protokolování a audit: Monitorujte interakce agentů prostřednictvím dostupných možností protokolování a auditu. Kontrola vzorů dotazů a kvality odpovědí pomáhá včas identifikovat neočekávané chování.
  • Lidská eskalace ve smyčce: Vytvořte cesty eskalace pro citlivé nebo požadavky s vysokým dopadem. V situacích, kdy automatizované odpovědi nestačí, definujte procesy, které směrují otázky kvalifikovaným kontrolorům.
  • Pravidelná kontrola: Pravidelně kontrolujte pokyny k datovému agentu a ukázkové dotazy, abyste měli jistotu, že zůstanou v souladu s aktuálními zásadami organizace a datovými strukturami. Při změně zdrojů dat nebo obchodních požadavků aktualizujte konfiguraci agenta odpovídajícím způsobem.

Omezení

  • Datový agent Fabric generuje pouze dotazy SQL, DAX a KQL pro čtení. Nevygeneruje dotazy SQL, DAX ani KQL, které vytvářejí, aktualizují nebo odstraňují data.
  • Datový agent Fabric nepodporuje nestrukturovaná data, jako jsou .pdf, .docxnebo .txt soubory. Nemůžete použít Fabric datového agenta pro přístup k nestrukturovaným datovým prostředkům.
  • U zdrojů dat lakehouse odpovídá agent Fabric pro data na otázky pomocí tabulek lakehouse, které vyberete. Nečte přímo samostatné soubory lakehouse (například soubory CSV nebo JSON), pokud se neingestují nebo nezpřístupní jako tabulky.
  • Datový agent Fabric v současné době nepodporuje jiné jazyky než angličtinu. Pokud chcete dosáhnout optimálního výkonu, zadejte dotazy, pokyny a ukázkové dotazy v angličtině.
  • LLM, který Fabric datového agenta používá, nemůžete změnit.
  • Historie konverzací ve Fabric data agentu nemusí být vždy uchovávána. V některých případech, například změny back-endové infrastruktury, aktualizace služeb nebo upgrady modelů, může dojít k resetování nebo ztrátě historie minulých konverzací.
  • Datový agent Fabric nemůže spouštět dotazy, pokud je kapacita pracovního prostoru zdroje dat v jiné oblasti než kapacita pracovního prostoru datového agenta. Například jezero s kapacitou v Severní Evropě selže, pokud je kapacita datového agenta ve Francii – střed.
  • Uživatelé můžou ve svém datovém agentu poskytnout až 100 ukázkových dotazů na zdroj dat.
  • Fabric datoví agenti jsou aktuálně navrženi pro konverzační přehledy, nikoli pro vrácení kompletních datových sad. Pokud chcete zajistit stručné a výkonné odpovědi, výstupy chatu automaticky omezují a/nebo sumarizují vrácená data. V současné době jsou odpovědi omezeny maximálně na 25 řádků a 25 sloupců. Upozorňujeme, že předchozí historie chatu může ovlivnit následné odpovědi. Pokud například požádáte o zobrazení všech řádků pro tento rok, agent stále vrátí maximálně 25 řádků. Následné otázky pak mohou být zodpovězeny na základě tohoto již omezeného kontextu, který může ovlivnit výsledek. V takových případech se doporučuje zahájit novou chatovací relaci.
  • Odpovědi agenta můžou být zkrácené nebo blokované, pokud Microsoft Purview zásady omezení ochrany před únikem informací nebo přístupu se vztahují na podkladové zdroje dat. Konkrétní chování závisí na konfiguraci zásad vaší organizace.
  • Prostředky, které jsou označené jako citlivé zásadami Purview, můžou být pro agenta nepřístupné, což může vést k neúplným odpovědím nebo nemožnosti dotazovat se na určité zdroje dat.
  • Interakce agentů můžou být protokolovány a zjistitelné prostřednictvím Microsoft Purview Audit a eDiscovery. Organizace by měly při nasazování agentů pro citlivé úlohy zvážit tyto kontroly zásad správného řízení.
  • Přístup k Power BI sémantických modelů prostřednictvím datového agenta se řídí oprávněním ke čtení v modelu a nevyžaduje přístup na úrovni pracovního prostoru. Řádkové zabezpečení (RLS) a Sloupcové zabezpečení (CLS) stále platí.