Del via


Konsepter for stoffdataagent (forhåndsversjon)

Dataagenten i Microsoft Fabric er en ny Microsoft Fabric-funksjon som gjør det mulig å bygge dine egne samtalebaserte Q&A-systemer ved å bruke generativ AI. En fabric-dataagent gjør datainnsikter mer tilgjengelige og gjennomførbare for alle i organisasjonen. Ved å bruke en Fabric-dataagent kan teamet ditt ha samtaler, med enkle spørsmål på engelsk, om dataene organisasjonen din lagret i Fabric OneLake og deretter motta relevante svar. På denne måten kan selv personer uten teknisk ekspertise innen kunstig intelligens eller en dyp forståelse av datastrukturen, få presise og kontekstrike svar.

Du kan også legge til organisasjonsspesifikke instruksjoner, eksempler og veiledning for å finjustere Fabric-dataagenten. Denne tilnærmingen sikrer at svarene samsvarer med organisasjonens behov og mål, slik at alle kan engasjere seg mer effektivt med data. Fabric Data Agent fremmer en kultur for datadrevet beslutningstaking fordi det senker barrierer for innsiktstilgjengelighet, legger til rette for samarbeid og hjelper organisasjonen din med å hente mer verdi ut av dataene sine.

Important

Denne funksjonen er i forhåndsvisning.

Prerequisites

Slik fungerer fabric-dataagenten

Fabric-dataagenten bruker store språkmodeller (LLM-er) for å hjelpe brukere med å samhandle naturlig med dataene sine. Fabric-dataagenten bruker Azure OpenAI Assistant-API-er og oppfører seg som en agent. Den behandler brukerspørsmål, bestemmer den mest relevante datakilden (Lakehouse, Warehouse, Power BI-datasett, KQL-databaser, ontologi), og bruker det riktige verktøyet for å generere, validere og utføre spørringer. Brukerne kan deretter stille spørsmål på enkelt språk og motta strukturerte, menneskelesbare svar. Denne tilnærmingen eliminerer behovet for å skrive komplekse spørringer og sikrer nøyaktig og sikker tilgang til data.

Slik fungerer det i detalj:

Spørsmålsanalyse og validering: Fabric-dataagenten bruker Azure OpenAI Assistant API-er som den underliggende agenten for å behandle brukerspørsmål. Denne fremgangsmåten sikrer at spørsmålet overholder sikkerhetsprotokoller, ansvarlige AI-policyer (RAI) og brukertillatelser. Fabric-dataagenten håndhever skrivebeskyttet tilgang, og opprettholder skrivebeskyttede datatilkoblinger til alle datakilder.

Datakildeidentifikasjon: Fabric-dataagenten bruker brukerens legitimasjon for å få tilgang til skjemaet til datakilden. Denne tilnærmingen sikrer at systemet henter datastrukturinformasjon som brukeren har tillatelse til å se. Agenten vurderer deretter brukerens spørsmål mot alle tilgjengelige datakilder, inkludert relasjonsdatabaser (Lakehouse og Warehouse), Power BI-datasett (Semantiske modeller), KQL-databaser og ontologier. Det kan også referere til brukerangitte dataagentinstruksjoner for å finne den mest relevante datakilden.

Verktøykalling og generering av spørringer: Når riktig datakilde eller kilder er identifisert, omformulerer Fabric-dataagenten spørsmålet for klarhet og struktur, og påkaller deretter det tilsvarende verktøyet for å generere en strukturert spørring:

  • Naturlig språk til SQL (NL2SQL) for relasjonsdatabaser (Lakehouse/Warehouse).
  • Naturlig språk til DAX (NL2DAX) for Power BI-datasett (semantiske modeller).
  • Naturlig språk til KQL (NL2KQL) for KQL-databaser.

Det valgte verktøyet genererer en spørring basert på det angitte skjemaet, metadataene og konteksten som agenten underliggende Fabric-dataagenten deretter sender.

Spørringsvalidering: Verktøyet utfører validering for å sikre at spørringen er korrekt utformet og følger sine egne sikkerhetsprotokoller og RAI-policyer.

Spørringsutførelse og svar: Når den er validert, utfører Fabric-dataagenten spørringen mot den valgte datakilden. Resultatene er formatert i et menneskelig lesbart svar, som kan omfatte strukturerte data, for eksempel tabeller, sammendrag eller viktig innsikt.

Ved å bruke denne tilnærmingen kan brukere samhandle med dataene sine ved hjelp av naturlig språk. Fabric-dataagenten håndterer kompleksiteten ved generering, validering og kjøring av spørringer. Brukere trenger ikke å skrive SQL, DAX eller KQL selv.

Konfigurasjon av stoffdataagent

Konfigurering av en Fabric-dataagent ligner på å bygge en Power BI-rapport – du starter med å utforme og finjustere den for å sikre at den oppfyller dine behov, og deretter publiserer og deler den med kolleger slik at de kan samhandle med dataene. Konfigurasjon av en fabric-dataagent innebærer:

Valg av datakilder: En Fabric-dataagent støtter opptil fem datakilder i en hvilken som helst kombinasjon, inkludert innsjøhus, lagerbygninger, KQL-databaser, Power BI-semantiske modeller og ontologier. En konfigurert fabric-dataagent kan for eksempel inkludere fem semantiske Power BI-modeller. Det kan inkludere en blanding av to Semantiske Power BI-modeller, én lakehouse og én KQL-database. Du har mange tilgjengelige alternativer.

Velge relevante tabeller: Etter at du har valgt datakildene, legg dem til én om gangen, og definer de spesifikke tabellene fra hver kilde som Fabric-dataagenten bruker. Dette trinnet sikrer at Fabric-dataagenten henter nøyaktige resultater ved å fokusere bare på relevante data. For lakehouses innebærer dette steget å velge lakehouse-tabeller (ikke individuelle lakehouse-filer). Hvis dataene dine starter som filer (for eksempel CSV eller JSON), gjør dem tilgjengelige for agenten ved å legge dem inn i tabeller eller på annen måte eksponere dem gjennom tabeller.

Legge til kontekst: For å forbedre nøyaktigheten til Fabric-dataagenten, gi mer kontekst gjennom instruksjoner og eksempelforespørsler. Som den underliggende agenten for Fabric-dataagenten hjelper konteksten Azure OpenAI Assistant API med å ta mer informerte beslutninger om hvordan du behandler brukerspørsmål, og bestemmer hvilken datakilde som passer best til å svare på dem.

  • Instruksjoner for dataagent: Legg til instruksjoner for å veilede agenten som ligger til grunn for Fabric-dataagenten, i å finne den beste datakilden for å besvare spesifikke typer spørsmål. Du kan også angi egendefinerte regler eller definisjoner som klargjør organisasjonsterminologi eller spesifikke krav. Disse instruksjonene kan gi mer kontekst eller preferanser som påvirker hvordan agenten velger og spør datakilder. For eksempel, direkte spørsmål om finansielle måleparametere til en Power BI-semantisk modell, tilordne spørringer som involverer utforskning av rådata til innsjøhuset, og rute spørsmål som krever logganalyse til KQL-databasen.

  • Eksempelforespørsler: Legg til eksempler på spørsmål-spørringspar for å illustrere hvordan Fabric-dataagenten bør svare på vanlige forespørsler. Disse eksemplene fungerer som en veiledning for agenten, som hjelper den med å forstå hvordan man tolker lignende spørsmål og genererer nøyaktige svar.

Note

Å legge til eksempelspørrings-/spørsmålspar støttes for øyeblikket ikke for datakilder for semantisk modell for Power BI.

Ved å kombinere klare ai-instruksjoner og relevante eksempelspørringer kan du bedre justere Fabric-dataagenten med organisasjonens databehov, noe som sikrer mer nøyaktige og kontekstavhengige svar.

Forskjellen mellom en fabric-dataagent og en copilot

Selv om både Fabric-dataagenter og Fabric-copiloter bruker generativ AI for å behandle og resonnere over data, finnes det viktige forskjeller i funksjonalitet og bruksområder:

Konfigurasjonsfleksibilitet: Du kan konfigurere Fabric-dataagenter på en høy måte. Du kan gi egendefinerte instruksjoner og eksempler for å skreddersy virkemåten deres til bestemte scenarier. Fabric copilots, derimot, er forhåndskonfigurert og tilbyr ikke dette nivået av tilpasning.

Omfang og brukstilfelle: Fabric-copiloter hjelper til med oppgaver i Microsoft Fabric, som å generere notatbokkode eller lagerforespørsler. Stoffdataagenter er derimot frittstående artefakter. Hvis du vil gjøre Fabric-dataagenter mer allsidige for bredere brukstilfeller, kan de integreres med eksterne systemer som Microsoft Copilot Studio, Azure AI Foundry, Microsoft Teams eller andre verktøy utenfor Fabric.

Evaluering av fabric-dataagenten

Produktteamet evaluerte grundig kvaliteten og sikkerheten til svar fra Fabric-dataagenter:

Benchmark-testing: Produktteamet testet Fabric-dataagenter på tvers av en rekke offentlige og private datasett for å sikre høy kvalitet og nøyaktige svar.

Forbedrede skadebegrensninger: Produktteamet implementerte sikkerhetstiltak for å sikre at Fabric-dataagentens resultater forblir fokusert på konteksten til utvalgte datakilder, noe som reduserer risikoen for irrelevante eller misvisende svar.

Limitations

Fabric-dataagenten er for øyeblikket i offentlig forhåndsvisning og har begrensninger. Oppdateringer vil forbedre fabric-dataagenten over tid.

  • Fabric-dataagenten genererer kun SQL-, DAX- og KQL-«lese»-spørringer. Den genererer ikke SQL-, DAX- eller KQL-spørringer som oppretter, oppdaterer eller sletter data.
  • Fabric-dataagenten støtter ikke ustrukturerte data, som .pdf, .docxeller .txt filer. Du kan ikke bruke dataagenten Fabric til å få tilgang til ustrukturerte dataressurser.
  • For lakehouse-datakilder svarer Fabric-dataagenten på spørsmål ved hjelp av lakehouse-tabellene du velger. Den leser ikke direkte frittstående Lakehouse-filer (for eksempel CSV- eller JSON-filer) med mindre de er importert eller eksponert som tabeller.
  • Fabric-dataagenten støtter for øyeblikket ikke ikke-engelske språk. For optimal ytelse, gi spørsmål, instruksjoner og eksempelforespørsler på engelsk.
  • Du kan ikke endre LLM som Fabric-dataagenten bruker.
  • Samtalehistorikken i Fabric-dataagenten vedvarer kanskje ikke alltid. I visse tilfeller, som endringer i backend-infrastruktur, tjenesteoppdateringer eller modelloppgraderinger, kan tidligere samtalehistorikk bli tilbakestilt eller mistet.
  • Fabric-dataagenten kan ikke utføre spørringer når datakildens arbeidsområdekapasitet er i en annen region enn dataagentens arbeidsområdekapasitet. For eksempel feiler et innsjøhus med kapasitet i Nord-Europa hvis dataagentens kapasitet er i France Central.