Share via


Concepten van Fabric-gegevensagenten (preview)

Gegevensagent in Microsoft Fabric is een nieuwe Microsoft Fabric-functie waarmee u uw eigen gespreks-Q&A-systemen kunt bouwen met behulp van generatieve AI. Een Fabric-gegevensagent maakt gegevensinzichten toegankelijker en geschikter voor iedereen in uw organisatie. Met een Fabric-gegevensagent kan uw team gesprekken voeren, met gewone vragen in het Engels, over de gegevens die uw organisatie heeft opgeslagen in Fabric OneLake en vervolgens relevante antwoorden ontvangen. Op deze manier kunnen zelfs mensen zonder technische expertise in AI of een grondige kennis van de gegevensstructuur nauwkeurige en contextrijke antwoorden krijgen.

U kunt ook organisatiespecifieke instructies, voorbeelden en richtlijnen toevoegen om de Fabric-gegevensagent af te stemmen. Deze aanpak zorgt ervoor dat antwoorden aansluiten op de behoeften en doelstellingen van uw organisatie, zodat iedereen effectiever kan communiceren met gegevens. Fabric-gegevensagent bevordert een cultuur van gegevensgestuurde besluitvorming, omdat het obstakels voor inzichttoegankelijkheid verlaagt, samenwerking vergemakkelijkt en uw organisatie helpt meer waarde uit de gegevens te halen.

Belangrijk

Deze functie is beschikbaar als preview-versie.

Vereiste voorwaarden

Hoe de Fabric-gegevensagent werkt

De Fabric-gegevensagent maakt gebruik van grote taalmodellen (LLM's) om gebruikers op natuurlijke wijze te helpen met hun gegevens te communiceren. De Fabric-gegevensagent past API's van Azure OpenAI Assistant toe en gedraagt zich als een agent. Het verwerkt vragen van gebruikers, bepaalt de meest relevante gegevensbron (Lakehouse, Warehouse, Power BI-gegevensset, KQL-databases, ontologie) en roept het juiste hulpprogramma aan om query's te genereren, valideren en uitvoeren. Gebruikers kunnen vervolgens vragen stellen in gewone taal en gestructureerde, door mensen leesbare antwoorden ontvangen, waardoor complexe query's niet meer hoeven te worden geschreven en dat ze nauwkeurige en veilige toegang tot gegevens kunnen garanderen.

Dit werkt als volgt in detail:

Vraagparsering en validatie: De Fabric-gegevensagent past API's van Azure OpenAI Assistant toe als de onderliggende agent om vragen van gebruikers te verwerken. Deze aanpak zorgt ervoor dat de vraag voldoet aan beveiligingsprotocollen, verantwoordelijk AI-beleid (RAI) en gebruikersmachtigingen. De Fabric-gegevensagent dwingt leesbaarheid strikt af en onderhoudt uitsluitend leesbare gegevensverbindingen met alle gegevensbronnen.

Gegevensbronidentificatie: de Fabric-gegevensagent gebruikt de referenties van de gebruiker om toegang te krijgen tot het schema van de gegevensbron. Deze aanpak zorgt ervoor dat het systeem gegevensstructuurgegevens ophaalt die de gebruiker heeft gemachtigd om te bekijken. Vervolgens wordt de vraag van de gebruiker geëvalueerd op basis van alle beschikbare gegevensbronnen, waaronder relationele databases (Lakehouse en Warehouse), Power BI-gegevenssets (Semantische modellen), KQL-databases en ontologieën. Het kan ook verwijzen naar instructies van de door de gebruiker verstrekte gegevensagent om de meest relevante gegevensbron te bepalen.

Aanroepen van hulpprogramma's en het genereren van query's: zodra de juiste gegevensbron of bronnen zijn geïdentificeerd, herformuleert de Fabric-gegevensagent de vraag voor duidelijkheid en structuur en roept vervolgens het bijbehorende hulpprogramma aan om een gestructureerde query te genereren:

  • Natuurlijke taal voor SQL (NL2SQL) voor relationele databases (Lakehouse/Warehouse).
  • Natuurlijke taal naar DAX (NL2DAX) voor Power BI-datasets (Semantische Modellen).
  • Natuurlijke taal naar KQL (NL2KQL) voor KQL-databases.

Met het geselecteerde hulpprogramma wordt een query gegenereerd op basis van het opgegeven schema, de metagegevens en de context die de onderliggende agent van de Fabric-gegevensagent doorgeeft.

Queryvalidatie: Het hulpprogramma voert validatie uit om ervoor te zorgen dat de query correct is gevormd en voldoet aan zijn eigen beveiligingsprotocollen en RAI-beleid.

Query-uitvoering en -reactie: na validatie voert de Fabric-gegevensagent de query uit op de gekozen gegevensbron. De resultaten worden opgemaakt in een door mensen leesbare reactie, waaronder gestructureerde gegevens, zoals tabellen, samenvattingen of belangrijke inzichten.

Deze aanpak zorgt ervoor dat gebruikers met hun gegevens kunnen communiceren met natuurlijke taal, terwijl de Fabric-gegevensagent de complexiteit van het genereren, valideren en uitvoeren van query's afhandelt, allemaal zonder dat gebruikers ZELF SQL, DAX of KQL hoeven te schrijven.

Configuratie van fabricgegevensagent

Het configureren van een Fabric-gegevensagent is vergelijkbaar met het bouwen van een Power BI-rapport. U begint met het ontwerpen en verfijnen om ervoor te zorgen dat deze voldoet aan uw behoeften en deze vervolgens publiceert en deelt met collega's, zodat ze met de gegevens kunnen communiceren. Het instellen van een Fabric-gegevensagent omvat:

Gegevensbronnen selecteren: Een Fabric-gegevensagent ondersteunt maximaal vijf gegevensbronnen in elke combinatie, waaronder lakehouses, magazijnen, KQL-databases, semantische Power BI-modellen en ontologieën. Een geconfigureerde Fabric-gegevensagent kan bijvoorbeeld vijf semantische Power BI-modellen bevatten. Het kan bestaan uit een combinatie van twee semantische Power BI-modellen, één lakehouse en één KQL-database. U hebt veel beschikbare opties.

Relevante tabellen kiezen: nadat u de gegevensbronnen hebt geselecteerd, voegt u ze één voor één toe en definieert u de specifieke tabellen uit elke bron die de Fabric-gegevensagent gebruikt. Deze stap zorgt ervoor dat de Fabric-gegevensagent nauwkeurige resultaten ophaalt door alleen te focussen op relevante gegevens.

Context toevoegen: Als u de nauwkeurigheid van de Fabric-gegevensagent wilt verbeteren, geeft u meer context via instructies en voorbeeldquery's voor de Fabric-gegevensagent. Als de onderliggende agent voor de Fabric-gegevensagent helpt de context de Api van de Azure OpenAI-assistent meer geïnformeerde beslissingen te nemen over het verwerken van gebruikersvragen en bepalen welke gegevensbron het meest geschikt is om ze te beantwoorden.

  • Instructies voor gegevensagent: voeg instructies toe om de agent te begeleiden die ten grondslag aan de Fabric-gegevensagent is gekoppeld, bij het bepalen van de beste gegevensbron om specifieke typen vragen te beantwoorden. U kunt ook aangepaste regels of definities opgeven die de terminologie van de organisatie of specifieke vereisten verduidelijken. Deze instructies kunnen meer context of voorkeuren bieden die van invloed zijn op de wijze waarop de agent gegevensbronnen selecteert en opvraagt.

    • Directe vragen over financiële kengetallen naar een Power BI semantisch model.
    • Wijs query's toe die betrekking hebben op onbewerkte gegevensverkenning naar lakehouse.
    • Routeer vragen die loganalyse vereisen naar de KQL-database.
  • Voorbeeldquery's: Voeg voorbeeldparen van vragen en query's toe om te illustreren hoe de Fabric-gegevensagent moet reageren op algemene query's. Deze voorbeelden dienen als richtlijn voor de agent, waarmee het inzicht krijgt in het interpreteren van vergelijkbare vragen en het genereren van nauwkeurige antwoorden.

Notitie

Het toevoegen van voorbeeldquery-/vraagparen wordt momenteel niet ondersteund voor gegevensbronnen van het semantische Power BI-model.

Door duidelijke AI-instructies en relevante voorbeeldquery's te combineren, kunt u de Fabric-gegevensagent beter afstemmen op de gegevensbehoeften van uw organisatie, zodat u nauwkeurigere en contextbewuste reacties kunt uitvoeren.

Verschil tussen een Fabric-gegevensagent en een copilot

Hoewel zowel Fabric-gegevensagents als Fabric-copilots gebruikmaken van generatieve AI om gegevens te verwerken en te redeneren, bestaan er belangrijke verschillen in hun functionaliteit en gebruiksvoorbeelden:

Configuratieflexubiliteit: U kunt Fabric-gegevensagents sterk configureren. U kunt aangepaste instructies en voorbeelden opgeven om hun gedrag aan te passen aan specifieke scenario's. Fabric-copilots zijn daarentegen vooraf geconfigureerd en bieden dit aanpassingsniveau niet aan.

Scope en Use Case: Fabric-copilots helpen bij taken in Microsoft Fabric, zoals het genereren van notebookcode of magazijnquery's. Fabric-gegevensagents zijn daarentegen zelfstandige artefacten. Om Fabric-gegevensagents veelzijdiger te maken voor bredere gebruiksvoorbeelden, kunnen ze worden geïntegreerd met externe systemen zoals Microsoft Copilot Studio, Azure AI Foundry, Microsoft Teams of andere hulpprogramma's buiten Fabric.

Evaluatie van de Fabric-gegevensagent

Het productteam heeft de kwaliteit en veiligheid van de reacties van de Fabric-gegevensagent grondig geëvalueerd:

Benchmark Testing: Het productteam testte Fabric-gegevensagenten in een reeks openbare en privé gegevenssets om hoogwaardige en nauwkeurige antwoorden te garanderen.

Verbeterde risicobeperking: het productteam heeft beveiligingsmaatregelen geïmplementeerd om ervoor te zorgen dat de uitvoer van de Fabric-gegevensagent gericht blijft op de context van geselecteerde gegevensbronnen, waardoor het risico op irrelevante of misleidende antwoorden wordt verminderd.

Beperkingen

De Fabric-gegevensagent is momenteel beschikbaar als openbare preview en heeft beperkingen. Updates verbeteren de Fabric-gegevensagent in de loop van de tijd.

  • De Fabric-gegevensagent genereert alleen SQL-, DAX- en KQL-leesquery's. Er worden geen SQL-, DAX- of KQL-query's gegenereerd waarmee gegevens worden gemaakt, bijgewerkt of verwijderd.
  • De Fabric-gegevensagent biedt geen ondersteuning voor ongestructureerde gegevens, zoals .pdf, .docxof .txt bestanden. U kunt de Fabric-gegevensagent niet gebruiken voor toegang tot ongestructureerde gegevensresources.
  • De Fabric-gegevensagent biedt momenteel geen ondersteuning voor niet-Engelse talen. Voor optimale prestaties geeft u vragen, instructies en voorbeeldquery's in het Engels.
  • U kunt de LLM die door de Fabric-gegevensagent wordt gebruikt, niet wijzigen.
  • Gespreksgeschiedenis in de Fabric-gegevensagent blijft mogelijk niet altijd bestaan. In bepaalde gevallen, zoals wijzigingen in de back-endinfrastructuur, service-updates of modelupgrades, kan de geschiedenis van het vorige gesprek opnieuw worden ingesteld of verloren gaan.
  • De Fabric-gegevensagent kan geen query's uitvoeren wanneer de capaciteit van de werkruimte van de gegevensbron zich in een andere regio bevindt dan de capaciteit van de werkruimte van de gegevensagent. Een lakehouse met capaciteit in Noord-Europa zal falen als de capaciteit van de dataagent zich in Centraal-Frankrijk bevindt.