Kommentar
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Dataagent i Microsoft Fabric är en allmänt tillgänglig funktion som gör att du kan skapa egna konversations-Q&A-system med generativ AI. Dataagenten gör datainsikter mer tillgängliga och användbara för alla i din organisation. Genom att använda en Fabric dataagent kan ditt team ha konversationer, med vanliga engelskspråkiga frågor, om de data som din organisation lagrade i Fabric OneLake och sedan få relevanta svar. På så sätt kan även personer utan teknisk expertis inom AI eller en djup förståelse av datastrukturen få exakta och sammanhangsrika svar. Inom bredare agentiska programarkitekturer på Microsoft Fabric fungerar dataagenter som komponent för konversationsanalys och ansluter till reglerade data i OneLake via lakehouses, lager, semantiska modeller och KQL-databaser i lösningar med flera agenter.
Du kan också lägga till organisationsspecifika instruktioner, exempel och vägledning för att finjustera Fabric dataagenten. Den här metoden säkerställer att svaren överensstämmer med organisationens behov och mål, så att alla kan interagera mer effektivt med data. Fabric dataagenten främjar en kultur av datadrivet beslutsfattande eftersom det minskar hinder för insiktstillgänglighet, underlättar samarbete och hjälper din organisation att extrahera mer värde från sina data.
Förutsättningar
- En betald F2 eller högre Fabric Kapacitet, eller en Power BI Premium kapacitet per kapacitet (P1 eller högre) med Microsoft Fabric Aktiverat.
- Aktivera kors-geo-bearbetning och kors-geo-lagring för AI baserat på krav som beskrivs i klientinställningarna för Fabricdataagenten.
- Minst en av dessa datakällor, med data: Ett lager, ett sjöhus, en Power BI-semantisk modell, en KQL-databas, en speglad databas eller en ontologi. Du måste ha läsbehörighet till datakällan.
Krav för styrning
Om din klientorganisation eller arbetsyta styrs av Microsoft Purview principer måste agenter arbeta inom dessa principer. Följande Purview-principer kan begränsa agentåtkomsten och de resultat som agenterna returnerar baserat på känslighet och principkonfiguration:
- Purview DLP-principer i Fabric Data Warehouse (allmänt tillgänglig): DLP-principer kan identifiera och begränsa åtkomsten till känsliga data i lagertillgångar som agenten frågar efter.
- Access-begränsningsprinciper (förhandsversion) för Fabric KQL Database, Fabric SQL Database och Fabric Data Warehouse: Dessa principer kan hindra agenten från att komma åt eller returnera resultat från tillgångar som klassificeras som känsliga.
Så här fungerar Fabric dataagenten
Den Fabric dataagenten använder stora språkmodeller (LLM: er) för att hjälpa användarna att interagera med sina data naturligt. Fabric-dataagenten tillämpar Azure API:er för OpenAI Assistant och fungerar som en agent. Den bearbetar användarfrågor, avgör den mest relevanta datakällan (Lakehouse, Warehouse, Power BI datauppsättning, KQL-databaser, ontologi eller Microsoft Graph) och anropar lämpligt verktyg för att generera, validera och köra frågor. Användarna kan sedan ställa frågor på vanligt språk och få strukturerade, läsbara svar från människor. Den här metoden eliminerar behovet av att skriva komplexa frågor och säkerställer korrekt och säker dataåtkomst.
Så här fungerar det i detalj:
Question parsing and validation: Fabric-dataagenten tillämpar Azure OpenAI Assistant-API:er som underliggande agent för att bearbeta användarfrågor. Den här metoden säkerställer att frågan uppfyller säkerhetsprotokoll, ansvarsfulla AI-principer (RAI) och användarbehörigheter. Fabric-dataagenten respekterar också Microsoft Purview styrningskontroller som tillämpas på underliggande Fabric datakällor, inklusive principer för dataförlustskydd (DLP) och principer för åtkomstbegränsning. Policytillämpning kan förhindra att vissa frågekommandon körs eller att specifika data visas i svar. Fabric-dataagenten upprätthåller strikt skrivskyddad åtkomst och bibehåller skrivskyddade dataanslutningar till alla datakällor.
Genomdrivandemekanismer: Fabric-dataagenten tillämpar flera skyddslager under bearbetningen. Den använder den begärande användarens autentiseringsuppgifter och behörigheter för att framtvinga åtkomst med lägsta behörighet, vilket säkerställer att varje interaktion endast når data som användaren har behörighet att visa. Agenten utvärderar begäranden mot klient- och arbetsyteprincipinställningar innan någon åtgärd utförs. Skyddsräcken begränsar verktygsanrop och utdata till begränsade datakällor, vilket förhindrar att frågor når resurser utanför det konfigurerade omfånget. Du kan också integrera Azure AI Content Safety för att tillämpa kontroller för innehållsrisk som bidrar till att minska skadliga eller out-of-policy-svar.
Datakällidentifiering: Fabric-dataagenten använder användarens autentiseringsuppgifter för att komma åt datakällans schema. Den här metoden säkerställer att systemet hämtar datastrukturinformation som användaren har behörighet att visa. Agenten utvärderar sedan användarens fråga mot alla tillgängliga datakällor, inklusive relationsdatabaser (Lakehouse och Warehouse), Power BI datauppsättningar (semantiska modeller), KQL-databaser, ontologier och Microsoft Graph. Den kan också referera till instruktioner från användarspecifika dataagenter för att fastställa den mest relevanta datakällan. För Power BI semantiska modeller använder agenten användarens läsbehörighet för modellen för att hämta schema och metadata för frågegenerering. Byggbehörighet krävs inte för agentdrivna frågor.
Tool-anrop och frågegenerering: När rätt datakälla eller källor har identifierats omformulerar Fabric dataagent frågan för tydlighet och struktur och anropar sedan motsvarande verktyg för att generera en strukturerad fråga:
- Naturligt språk till SQL (NL2SQL) för relationsdatabaser (Lakehouse/Warehouse).
- Naturligt språk till DAX (NL2DAX) för Power BI datauppsättningar (semantiska modeller).
- Naturligt språk till KQL (NL2KQL) för KQL-databaser. NL2KQL kan använda KQL-användardefinierade funktioner (UDF:er) när de är tillgängliga i de valda databaserna.
- Microsoft Graph förfrågningar för organisationsdata som är tillgängliga via Microsoft Graph.
Det valda verktyget genererar en fråga baserat på det angivna schemat, metadata och kontexten som agenten som ligger bakom Fabric dataagenten sedan skickar.
Frågevalidering: Verktyget utför validering för att säkerställa att frågan är korrekt utformad och följer sina egna säkerhetsprotokoll och RAI-principer.
Querykörning och svar: När Fabricdataagenten har verifierats kör den frågan mot den valda datakällan. Resultaten formateras till ett mänskligt läsbart svar, som kan innehålla strukturerade data som tabeller, sammanfattningar eller viktiga insikter.
Med den här metoden kan användarna interagera med sina data med hjälp av naturligt språk. Fabric-dataagenten hanterar komplexiteten i frågegenerering, validering och körning. Användarna behöver inte själva skriva SQL, DAX eller KQL.
Säkerhet och styrning med Microsoft Purview
Microsoft Purview tillhandahåller styrnings- och riskkontroller för Fabric dataagenter. Dessa funktioner är för närvarande i förhandsversion och hjälper organisationer att upprätthålla efterlevnad när de använder agenter för att komma åt Fabric data. Exempel på viktiga funktioner:
- Risk identifiering och granskning: Uppmaningar och svar från Fabric dataagenter kan omfattas av Purview-riskidentifiering och granskning, vilket ger säkerhetsteam insyn i hur agenter interagerar med organisationsdata.
- DSPM-datariskbedömningar: Datariskbedömningar (Data Security Posture Management) (DSPM) kan visa känsliga datarisker i de datakällor som agenter använder, vilket hjälper dig att identifiera och åtgärda potentiell exponering.
- Hantering av insiderrisk: Purview Insider Risk Management kan identifiera riskfyllda AI-användningsmönster som involverar agenter, till exempel ovanliga frågevolymer eller åtkomst till känsliga data.
- Audit, eDiscovery och lagring: Purview Audit, eDiscovery och lagringsprinciper gäller för agentinteraktioner och resultat i Fabric arbetsflöden som stöds. Icke-kompatibel användningsidentifiering kan också flagga agentaktivitet som bryter mot organisationens principer.
Mer information om hur Microsoft Purview integreras med Fabric finns i Använd Microsoft Purview för att styra Microsoft Fabric.
Konfiguration av Fabric-dataagent
Att konfigurera en Fabric dataagent liknar att skapa en Power BI rapport – du börjar med att utforma och förfina den för att säkerställa att den uppfyller dina behov och sedan publicera och dela den med kollegor så att de kan interagera med data. När du konfigurerar en Fabric dataagent ingår:
Välja datakällor: En Fabric dataagent stöder upp till fem datakällor i valfri kombination, inklusive sjöhus, lager, KQL-databaser, Power BI semantiska modeller, ontologier och Microsoft Graph. Till exempel kan en konfigurerad Fabric dataagent innehålla fem Power BI semantiska modeller. Den kan innehålla en blandning av två Power BI semantiska modeller, en lakehouse och en KQL-databas. Du har många tillgängliga alternativ.
Välj relevanta tabeller: När du har valt datakällorna lägger du till dem en i taget och definierar de specifika tabellerna från varje källa som Fabric dataagenten använder. Det här steget säkerställer att Fabric dataagenten hämtar korrekta resultat genom att endast fokusera på relevanta data. För lakehouses innebär det här steget att välja lakehouse-tabeller (inte enskilda lakehouse-filer). Om dina data börjar som filer (till exempel CSV eller JSON) gör du dem tillgängliga för agenten genom att mata in dem i tabeller eller på annat sätt exponera dem via tabeller.
Adding Context: Om du vill förbättra Fabric dataagentens noggrannhet ger du mer kontext genom Fabric instruktioner för dataagenten och exempelfrågor. Som underliggande agent för Fabric dataagent hjälper kontexten Azure OpenAI Assistant API att fatta mer välgrundade beslut om hur du bearbetar användarfrågor och avgör vilken datakälla som passar bäst för att besvara dem.
Dataagentinstruktioner: Lägg till instruktioner som vägleder agenten som ligger till grund för Fabric dataagenten för att fastställa den bästa datakällan för att besvara specifika typer av frågor. Du kan också ange anpassade regler eller definitioner som förtydligar organisationens terminologi eller specifika krav. Dessa instruktioner kan ge mer kontext eller inställningar som påverkar hur agenten väljer och frågar datakällor. Till exempel, ställ direkta frågor om finansiella mått till en Power BI-semantisk modell, tilldela frågor som rör rå datautforskning till lakehouse och dirigera frågor som kräver logganalys till KQL-databasen.
Example-frågor: Lägg till exempel på frågefrågepar för att illustrera hur Fabric dataagenten ska svara på vanliga frågor. De här exemplen fungerar som en guide för agenten, som hjälper den att förstå hur man tolkar liknande frågor och genererar korrekta svar.
Anmärkning
Det går för närvarande inte att lägga till exempel på fråge-/frågepar för Power BI semantiska modelldatakällor.
Genom att kombinera tydliga AI-instruktioner och relevanta exempelfrågor kan du bättre anpassa Fabric dataagenten till organisationens databehov, vilket säkerställer mer exakta och sammanhangsmedvetna svar.
Viktigt!
Instruktioner för dataagenter som tillhandahålls av utvecklare och exempelfrågor måste fungera inom organisations- och rollbaserade begränsningar. Om instruktioner eller uppmaningar står i konflikt med principen (till exempel försök att kringgå skrivskyddat beteende eller komma åt källor utanför omfånget) nekar eller omdirigerar agenten begäran enligt prioritetsmodellen som beskrivs i följande avsnitt.
Styrnings- och avsiktslager
När du konfigurerar en Fabric dataagent kan flera lager av avsikter påverka hur agenten beter sig. Dessa lager, listade från högsta till lägsta prioritet, definierar vad agenten får göra:
- Organisations avsikt: Principer för hela klientorganisationen och efterlevnadskrav som angetts av organisationens administratörer. Dessa begränsningar har högsta prioritet och kan inte åsidosättas av något annat lager.
- Rollbaserad avsikt: Inställningar för arbetsytestyrning och behörighetsgränser som gäller för specifika roller eller grupper. De här inställningarna tillämpar åtkomstkontroller och begränsningar för dataomfattning.
- Avsikt för utvecklare: Anpassade instruktioner, exempelfrågor och konfigurationer av datakällor som du anger när du skapar dataagenten.
- Användar avsikt: Frågor och uppmaningar som slutanvändarna skickar under konversationer med agenten.
När konflikter uppstår mellan lager åsidosätter lager med högre prioritet lägre. Organisationsprinciper och arbetsytestyrningsinställningar åsidosätter till exempel alltid utvecklarinstruktioner och användarfrågor. Den här prioritetsmodellen säkerställer att agenten fungerar inom godkända gränser, oavsett hur den konfigureras eller uppmanas.
Skillnad mellan en Fabric dataagent och en andrepilot
Både Fabric-dataagenter och Fabric-copiloter kan använda generativ AI för att bearbeta och analysera data, men det finns viktiga skillnader i hur de fungerar och används.
Konfigurationsflexibilitet: Du kan i hög grad konfigurera Fabric-dataagenter. Du kan ange anpassade instruktioner och exempel för att anpassa deras beteende till specifika scenarier. Fabric co-piloter, å andra sidan, är förkonfigurerade och erbjuder inte den här nivån av anpassningar.
Scope och användningsfall: Fabric copiloter hjälper till med uppgifter inom Microsoft Fabric, till exempel att generera notebook-kod eller databasfrågor. Fabric data agenter är däremot självstående konfigurerbara artefakter som kan köra frågor mot data i OneLake och semantiska modeller. Fabric dataagenter kan också integreras med Microsoft 365 Copilot för att visa insikter på naturligt språk direkt i Microsoft 365 appar. När agenter nås via Microsoft 365 Copilot gäller Microsoft Purview styrningsprinciper fortfarande för de underliggande datakällorna. Dessutom kan Fabric dataagenter ansluta till externa system som Microsoft Copilot Studio, Azure AI Foundry, Microsoft Teams eller andra verktyg utanför Fabric. Externa orkestrerare och multiagentkörningar kan anropa Fabric-dataagenter för att stödja agentbaserade arbetsflöden från början till slut, medan dataagenterna fortfarande är inriktade på skrivskyddad, styrd dataåtkomst.
Utvärdering av Fabric-dataagenten
Produktteamet utvärderade noggrant kvaliteten och säkerheten för Fabric dataagentsvar:
Benchmark Testing: Produktteamet testade Fabric dataagenter i en rad offentliga och privata datauppsättningar för att säkerställa högkvalitativa och korrekta svar.
Enhanced Harm Mitigations: Produktteamet implementerade skyddsåtgärder för att säkerställa att Fabric dataagentens utdata förblir fokuserade på kontexten för valda datakällor, vilket minskar risken för irrelevanta eller vilseledande svar.
Styrning och säkerhet
Microsoft Purview integrering tillhandahåller styrningskontroller för Fabric dataagenter. När du konfigurerar en dataagent gäller Purview-styrningsprinciper för de underliggande datakällor som agenten kan komma åt. Den här integreringen säkerställer att dataåtkomst via agenter följer samma efterlevnads- och klassificeringsregler som direkt åtkomst.
Microsoft Purview-principer: Purview-principer som dataåtkomstkontroller och känslighetsetiketter gäller för datakällor som agenter frågar efter. Om en Purview-princip begränsar åtkomsten till ett lakehouse eller lager, respekterar agenten den begränsningen vid bearbetning av användarfrågor.
Outbound access protection: Fabric-dataagenter fungerar inom arbetsytans utgående åtkomstskyddsgränser. Arbetsyteadministratörer kan hantera tillåtna utgående anslutningar via arbetsyteinställningarna för att styra vilka externa slutpunkter dataagenten kan nå.
Microsoft 365 Copilot integration: När Fabric dataagenter visas via Microsoft 365 Copilot fortsätter Purview-styrningsprinciper att gälla. Användare kan bara komma åt data som deras autentiseringsuppgifter och Purview-principer tillåter, oavsett startpunkt.
ALM och DevOps för dataagenter
Fabric dataagenter stöder alm-funktioner (application lifecycle management) som hjälper dig att hantera agentkonfigurationer i utvecklings-, test- och produktionsmiljöer.
Diagnostik: Använd inbyggd diagnostik för att övervaka agentbeteende, identifiera problem med frågegenerering och felsöka svarskvalitet. Diagnostik ger insyn i hur agenten bearbetar frågor och väljer datakällor.
Git-integrering: Du kan versionskontrollera dina agentkonfigurationer med Git-integrering. Anslut din Fabric-arbetsyta till en Git-lagringsplats för att spåra ändringar i agentinstruktioner, exempelfrågor och val av datakälla över tid.
Distributionspipelines: Använd Fabric distributionspipelines för att befordra dataagenter mellan arbetsytor (till exempel från utveckling till produktion). Med det här stödet kan du testa ändringar i en mellanlagringsmiljö innan du gör dem tillgängliga för slutanvändare.
Operativ tillsyn
För att upprätthålla kontinuerlig kvalitets- och principjustering bör du överväga dessa operativa metoder för din Fabric dataagent:
- Loggning och granskning: Övervaka agentinteraktioner via tillgängliga funktioner för loggning och granskning. Genom att granska frågemönster och svarskvalitet kan du identifiera oväntat beteende tidigt.
- Människostyrd eskalering: Upprätta eskaleringsvägar för känsliga eller högaffekterande begäranden. För scenarier där automatiserade svar inte räcker definierar du processer som dirigerar frågor till kvalificerade granskare.
- Periodisk granskning: Granska regelbundet dina dataagentinstruktioner och exempelfrågor för att säkerställa att de förblir anpassade till aktuella organisationsprinciper och datastrukturer. När dina datakällor eller affärskrav ändras uppdaterar du agentkonfigurationen i enlighet med detta.
Begränsningar
- Den Fabric dataagenten genererar endast SQL-, DAX- och KQL-"läsfrågor". Den genererar inte SQL-, DAX- eller KQL-frågor som skapar, uppdaterar eller tar bort data.
- Fabric-dataagenten stöder inte ostrukturerade data, till exempel .pdf, .docxeller .txt filer. Du kan inte använda Fabric dataagenten för att komma åt ostrukturerade dataresurser.
- För lakehouse-datakällor svarar Fabric-dataagenten på frågor med hjälp av de lakehouse-tabeller som du väljer. Den läser inte fristående Lakehouse-filer direkt (till exempel CSV- eller JSON-filer) om de inte matas in eller exponeras som tabeller.
- Fabric-dataagenten stöder för närvarande inte icke-engelska språk. För optimala prestanda kan du ange frågor, instruktioner och exempelfrågor på engelska.
- Du kan inte ändra den LLM som Fabric dataagenten använder.
- Konversationshistoriken i Fabric dataagenten kanske inte alltid finns kvar. I vissa fall, till exempel ändringar i serverdelsinfrastrukturen, tjänstuppdateringar eller modelluppgraderingar, kan tidigare konversationshistorik återställas eller gå förlorad.
- Den Fabric dataagenten kan inte köra frågor när datakällans arbetsytekapacitet finns i en annan region än dataagentens arbetsytekapacitet. Till exempel misslyckas en lakehouse med kapacitet i norra Europa om dataagentens kapacitet finns i centrala Frankrike.
- Användare kan tillhandahålla upp till 100 exempelfrågor per datakälla i sin dataagent.
- För närvarande är Fabric Data-agenter utformade för insikter från samtal snarare än för att returnera kompletta datauppsättningar. För att säkerställa koncisa och högpresterande svar begränsar chattutdata automatiskt och/eller sammanfattar de data som returneras. För närvarande begränsas svaren till högst 25 rader och 25 kolumner. Observera att tidigare chatthistorik kan påverka efterföljande svar. Om du till exempel ber om att "visa alla rader för det här året" returnerar agenten fortfarande högst 25 rader. Uppföljningsfrågor kan sedan besvaras baserat på den här redan begränsade kontexten, vilket kan påverka resultatet. I sådana fall rekommenderas att du startar en ny chattsession.
- Agentsvar kan trunkeras eller blockeras om Microsoft Purview DLP- eller åtkomstbegränsningsprinciper gäller för de underliggande datakällorna. Det specifika beteendet beror på organisationens principkonfiguration.
- Tillgångar som har markerats som känsliga av Purview-principer kan vara otillgängliga för agenten, vilket kan leda till ofullständiga svar eller en oförmåga att fråga vissa datakällor.
- Agentinteraktioner kan loggas och identifieras via Microsoft Purview Audit och eDiscovery. Organisationer bör överväga dessa styrningskontroller när de distribuerar agenter för känsliga arbetsbelastningar.
- Åtkomst till Power BI semantiska modeller via en dataagent styrs av läsbehörighet för modellen och kräver inte åtkomst på arbetsytenivå. Row-Level Security (RLS) och Column-Level Security (CLS) gäller fortfarande.