Share via


Een Fabric-gegevensagent maken (preview)

Met een gegevensagent in Microsoft Fabric kunt u conversationele AI-ervaringen maken die vragen beantwoorden over gegevens die zijn opgeslagen in lakehouses, magazijnen, semantische Power BI-modellen, KQL-databases en ontologieën in Fabric. Uw collega's kunnen vragen stellen in het Engels en gegevensgestuurde antwoorden ontvangen, zelfs als ze geen AI-experts zijn of diep vertrouwd zijn met de gegevens.

Belangrijk

Deze functie is beschikbaar als preview-versie.

Vereiste voorwaarden

Verificatie en tokens

U hoeft geen Azure OpenAI-sleutel of een toegangstoken te maken of op te geven om een Fabric-gegevensagent te gebruiken. Fabric maakt gebruik van een door Microsoft beheerde Azure OpenAI-assistent en verwerkt verificatie voor u.

  • Gegevenstoegang wordt uitgevoerd onder uw Microsoft Entra ID-gebruikersidentiteit en uw werkruimte-/gegevensmachtigingen. De agent leest schema's en voert SQL/DAX/KQL alleen uit als u toegang hebt.
  • Als u een semantisch Power BI-model als gegevensbron wilt toevoegen, hebt u leesmachtiging voor dat model nodig (schrijven is niet vereist). Leestoegang is ook voldoende om vragen te stellen op basis van bronnen die u kunt openen. Zie Gegevensset- en semantische modelbeveiliging voor meer informatie over semantische modelmachtigingen.
  • Als uw organisatie een Power BI Premium-capaciteit (P1 of hoger) gebruikt in plaats van een F SKU, controleert u of Microsoft Fabric is ingeschakeld voor die capaciteit.
  • Service-principals en API-tokens zijn niet vereist voor de chatervaring in het product. Automatisering met service-principals is een afzonderlijk scenario en wordt hier niet behandeld.

End-to-end-stroom voor het maken en verbruiken van Fabric-gegevensagenten

In deze sectie vindt u een overzicht van de belangrijkste stappen voor het maken, valideren en delen van een Fabric-gegevensagent in Fabric, waardoor deze toegankelijk is voor gebruik.

Het proces is eenvoudig en u kunt binnen enkele minuten beginnen met het testen van de resources van de Fabric-gegevensagent.

Een nieuwe Fabric-gegevensagent maken

Als u een nieuwe Fabric-gegevensagent wilt maken, gaat u eerst naar uw werkruimte en selecteert u vervolgens de knop + Nieuw item . Zoek op het tabblad Alle items naar fabric-gegevensagent om de juiste optie te vinden, zoals wordt weergegeven in deze schermopname:

Schermopname die de creatie toont van een Fabric-gegevensagent.

Zodra deze optie is geselecteerd, wordt u gevraagd een naam op te geven voor uw Fabric-gegevensagent, zoals wordt weergegeven in deze schermopname:

Schermopname van het opgeven van de naam voor de Fabric-gegevensagent.

Raadpleeg de opgegeven schermopname voor een visuele handleiding over het benoemen van de Fabric-gegevensagent. Nadat u de naam hebt ingevoerd, gaat u verder met de configuratie om de Fabric-gegevensagent af te stemmen op uw specifieke vereisten.

Uw gegevens selecteren

Nadat u een Fabric-gegevensagent hebt gemaakt, kunt u maximaal vijf gegevensbronnen toevoegen, waaronder lakehouses, magazijnen, semantische Power BI-modellen, KQL-databases en ontologieën, in elke combinatie (maximaal vijf totalen). U kunt bijvoorbeeld vijf semantische Power BI-modellen of twee semantische Power BI-modellen, één lakehouse en één KQL-database toevoegen.

Wanneer u voor het eerst een Fabric-gegevensagent maakt en een naam opgeeft, wordt de OneLake-catalogus automatisch weergegeven, zodat u gegevensbronnen kunt toevoegen. Als u een gegevensbron wilt toevoegen, selecteert u deze in de catalogus, zoals wordt weergegeven op het volgende scherm en selecteert u Vervolgens Toevoegen. Elke gegevensbron moet afzonderlijk worden toegevoegd. U kunt bijvoorbeeld een lakehouse toevoegen, Toevoegen selecteren en vervolgens doorgaan met het toevoegen van een andere gegevensbron. Als u de gegevensbrontypen wilt filteren, selecteert u het filterpictogram en selecteert u vervolgens het gewenste type. U kunt alleen de gegevensbronnen van het geselecteerde type weergeven, zodat u de juiste bronnen voor uw Fabric-gegevensagent gemakkelijker kunt vinden en verbinden.

Zodra u de gegevensbron hebt toegevoegd, wordt de Verkenner in het linkerdeelvenster van de pagina Fabric-gegevensagent gevuld met de beschikbare tabellen in elke geselecteerde gegevensbron, waar u de selectievakjes kunt gebruiken om tabellen beschikbaar te maken of niet beschikbaar te maken voor de AI, zoals wordt weergegeven in de volgende schermopname:

Schermopname die laat zien hoe u gegevensbronnen toevoegt.

Notitie

U hebt alleen leesmachtigingen nodig om een semantisch Power BI-model toe te voegen als gegevensbron. Schrijfmachtiging is niet vereist omdat de Fabric data-agent alleen-lezen queries uitvoert.

Voor latere toevoegingen van gegevensbronnen gaat u naar de Explorer in het linkerpaneel van de pagina van de Fabric-gegevensagent en selecteert u + Gegevensbron, zoals weergegeven in deze schermafbeelding.

Schermopname van het toevoegen van meer gegevensbronnen.

De OneLake-catalogus wordt opnieuw geopend en u kunt zo nodig naadloos meer gegevensbronnen toevoegen.

Hint

Zorg ervoor dat u beschrijvende namen gebruikt voor zowel tabellen als kolommen. Een tabel met de naam SalesData is duidelijker dan TableAen kolomnamen zoals ActiveCustomer of IsCustomerActive zijn duidelijker dan C1 of ActCu. Beschrijvende namen helpen de AI nauwkeurigere en betrouwbare query's te genereren.

Vragen stellen

Nadat u de gegevensbronnen hebt toegevoegd en de relevante tabellen voor elke gegevensbron hebt geselecteerd, kunt u beginnen met het stellen van vragen. Het systeem verwerkt vragen, zoals wordt weergegeven in deze schermopname:

Een schermopname met een vraag voor een Fabric-gegevensagent.

Vragen die vergelijkbaar zijn met deze voorbeelden, moeten ook werken:

  • "Wat waren onze totale verkoop in Californië in 2023?"
  • "Wat zijn de 5 beste producten met de hoogste lijstprijzen en wat zijn hun categorieën?"
  • "Wat zijn de duurste artikelen die nooit zijn verkocht?"

Vragen zoals deze zijn geschikt omdat het systeem ze kan vertalen in gestructureerde query's (T-SQL, DAX of KQL), ze uitvoeren op databases en vervolgens concrete antwoorden retourneren op basis van opgeslagen gegevens.

Vragen zoals deze vallen echter buiten het bereik:

  • "Waarom is onze fabrieksproductiviteit lager in Q2 2024?"
  • "Wat is de hoofdoorzaak van onze verkooppieken?"

Deze vragen vallen momenteel buiten het bereik, omdat hiervoor complexe redenering, correlatieanalyse of externe factoren nodig zijn die niet rechtstreeks beschikbaar zijn in de database. De Fabric-gegevensagent voert momenteel geen geavanceerde analyses, machine learning of causale deductie uit. Er worden eenvoudigweg gestructureerde gegevens opgehaald en verwerkt op basis van de query van de gebruiker.

Wanneer u een vraag stelt, gebruikt de Fabric-gegevensagent de Api van de Azure OpenAI-assistent om de aanvraag te verwerken. De stroom werkt op deze manier:

Schematoegang met gebruikersinloggegevens

Het systeem gebruikt eerst de inloggegevens van de gebruiker om toegang te krijgen tot het schema van de gegevensbron (bijvoorbeeld een lakehouse, warehouse, PBI-sematisch model, KQL-databases of ontologie). Dit zorgt ervoor dat het systeem gegevensstructuurgegevens ophaalt die de gebruiker heeft gemachtigd om te bekijken.

Een prompt samenstellen

Het systeem combineert het volgende om de vraag van de gebruiker te interpreteren:

  1. Gebruikersquery: De vraag in natuurlijke taal van de gebruiker.
  2. Schemagegevens: metagegevens en structurele details van de gegevensbron die in de vorige stap zijn opgehaald.
  3. Voorbeelden en instructies: vooraf gedefinieerde voorbeelden (bijvoorbeeld voorbeeldvragen en antwoorden) of specifieke instructies bij het instellen van de Fabric-gegevensagent. Deze voorbeelden en instructies helpen het begrip van de vraag te verfijnen en te bepalen hoe de AI communiceert met de gegevens.

Al deze informatie wordt gebruikt om een prompt samen te stellen. Deze prompt fungeert als invoer voor de Azure OpenAI-Assistant API, die zich gedraagt als een agent van de onderliggende Fabric-gegevensagent. Dit geeft in wezen de Fabric-gegevensagent instructies over het verwerken van de query en het type antwoord dat moet worden geproduceerd.

Het aanroepen van tools op basis van querybehoeften

De agent analyseert de samengestelde prompt en bepaalt welk hulpprogramma moet worden aangeroepen om het antwoord op te halen:

  • Natuurlijke taal naar SQL (NL2SQL): Wordt gebruikt om SQL-query's te genereren wanneer de gegevens zich in een lakehouse of datamagazijn bevinden.
  • Natuurlijke taal voor DAX (NL2DAX): wordt gebruikt om DAX-query's te maken om te communiceren met semantische modellen in Power BI-gegevensbronnen
  • Natuurlijke taal naar KQL (NL2KQL): wordt gebruikt om KQL-query's te maken om query's uit te voeren op gegevens in KQL-databases

Het geselecteerde hulpprogramma genereert een query met behulp van het schema, de metagegevens en de context die de agent onder de Fabric-gegevensagent levert. Vervolgens valideert het hulpprogramma de query, om de juiste opmaak en naleving van de bijbehorende beveiligingsprotocollen en zijn eigen verantwoordelijke AI-beleid (RAI) te garanderen.

Opbouw van de respons

De agent die onder de Fabric-gegevensagent ligt, voert de query uit en zorgt ervoor dat het antwoord op de juiste wijze is gestructureerd en opgemaakt. De agent bevat vaak extra context om het antwoord gebruiksvriendelijk te maken. Ten slotte wordt het antwoord weergegeven aan de gebruiker in een gespreksinterface, zoals wordt weergegeven in de volgende schermopname:

Schermopname van het antwoord op de vraag door een Fabric-gegevensagent.

De agent geeft zowel het resultaat als de tussenliggende stappen weer die nodig zijn om het uiteindelijke antwoord op te halen. Deze aanpak verbetert de transparantie en maakt het mogelijk om deze stappen, indien nodig, te valideren. Gebruikers kunnen de vervolgkeuzelijst voor de stappen uitvouwen om alle stappen weer te geven die de Fabric-gegevensagent heeft genomen om het antwoord op te halen, zoals wordt weergegeven in de volgende schermopname:

Schermopname die de stappen toont die zijn uitgevoerd door een Fabric-gegevensagent.

Daarnaast biedt de Fabric-gegevensagent de gegenereerde code die wordt gebruikt om een query uit te voeren op de bijbehorende gegevensbron, wat meer inzicht biedt in de manier waarop het antwoord is samengesteld.

Deze query's zijn uitsluitend ontworpen voor het uitvoeren van query's op gegevens. Bewerkingen waarbij gegevens worden gemaakt, gegevensupdates, gegevensverwijderingen, elk type gegevenswijziging zijn niet toegestaan om de integriteit van uw gegevens te beschermen.

U kunt op elk gewenst moment de knop Chat wissen selecteren om de chat te wissen, zoals wordt weergegeven in de volgende schermopname:

Schermopname met de functie Chat wissen gemarkeerd.

De functie 'Chat wissen' verwijdert alle chatgeschiedenis en start een nieuwe sessie. Zodra u uw chatgeschiedenis hebt verwijderd, kunt u deze niet meer ophalen.

De gegevensbron wijzigen

Als u een gegevensbron wilt verwijderen, plaatst u de muisaanwijzer op de naam van de gegevensbron in de Explorer in het linkerdeelvenster op de pagina van de Fabric-gegevensagent totdat het menu met drie punten wordt weergegeven. Selecteer de drie puntjes om de opties weer te geven en selecteer vervolgens Verwijderen om de gegevensbron te verwijderen, zoals wordt weergegeven in de volgende schermopname:

Schermopname die laat zien hoe u gegevensbronnen verwijdert of vernieuwt.

Als uw gegevensbron is gewijzigd, kunt u ook Vernieuwen selecteren in hetzelfde menu, zoals wordt weergegeven in de volgende schermopname:

Schermopname die laat zien hoe u een gegevensbron vernieuwt.

Dit zorgt ervoor dat updates van gegevensbronnen zowel worden weergegeven als correct zijn ingevuld in de verkenner om uw Fabric-gegevensagent gesynchroniseerd te houden met de meest recente gegevens.

Configuratie van fabricgegevensagent

De Fabric-gegevensagent biedt verschillende configuratieopties waarmee gebruikers het gedrag van de Fabric-gegevensagent kunnen aanpassen, zodat ze beter aan de behoeften van uw organisatie voldoen. Naarmate de Fabric-gegevensagent gegevens verwerkt en presenteert, bieden deze configuraties flexibiliteit die meer controle over de resultaten mogelijk maakt.

Instructies opgeven

U kunt specifieke instructies opgeven om het gedrag van ai te begeleiden. Als u ze wilt toevoegen in het deelvenster Instructies voor de Fabric-gegevensagent, selecteert u instructies voor de gegevensagent , zoals wordt weergegeven in de volgende schermopname:

Schermopname van de selectie van de knop Instructies voor de gegevensagent.

Hier kunt u maximaal 15.000 tekens schrijven in gewone Engelse tekst om de AI te instrueren over het afhandelen van query's.

U kunt bijvoorbeeld de exacte gegevensbron opgeven die moet worden gebruikt voor bepaalde typen vragen. Voorbeelden van keuzes voor gegevensbronnen kunnen betrekking hebben op het aansturen van de AI om deze te gebruiken.

  • Semantische Power BI-modellen voor financiële query's
  • een data lakehouse voor verkoopgegevens
  • een KQL-database voor operationele metrische gegevens

Deze instructies zorgen ervoor dat de AI de juiste query's genereert, ongeacht of SQL, DAX of KQL, op basis van uw richtlijnen en de context van de vragen.

Als uw AI-resource bepaalde woorden, acroniemen of termen consistent verkeerd interpreteert, kunt u proberen duidelijke definities in deze sectie op te geven om ervoor te zorgen dat de AI deze correct begrijpt en verwerkt. Dit wordt vooral handig voor domeinspecifieke terminologie of unieke zakelijke jargon.

Door deze instructies aan te passen en termen te definiëren, verbetert u het vermogen van AI om nauwkeurige en relevante inzichten te leveren, in volledige overeenstemming met uw gegevensstrategie en bedrijfsvereisten.

Voorbeeldquery's opgeven

U kunt de nauwkeurigheid van de reactie verbeteren door voorbeeldquery's op te geven die zijn afgestemd op elke ondersteunde gegevensbron (lakehouse, magazijn, KQL-database). Deze benadering, bekend als few-shot learning in generatieve AI, helpt de Fabric-gegevensagent om reacties te genereren die beter aansluiten op uw verwachtingen.

Wanneer u de AI van voorbeeldquery's en vraagparen voorziet, verwijst de AI naar deze voorbeelden om toekomstige vragen te beantwoorden. Door nieuwe query's te koppelen aan de meest relevante voorbeelden, kan de AI bedrijfsspecifieke logica opnemen en effectief reageren op veelgestelde vragen. Deze functionaliteit maakt het mogelijk om afzonderlijke gegevensbronnen af te stemmen en zorgt voor het genereren van nauwkeurigere SQL- of KQL-query's.

Semantische Power BI-modelgegevens bieden momenteel geen ondersteuning voor het toevoegen van voorbeeldquery-/vraagparen. Voor ondersteunde gegevensbronnen, zoals lakehouse-, magazijn- en KQL-databases, kan het bieden van meer voorbeelden het vermogen van AI om nauwkeurige query's te genereren aanzienlijk verbeteren wanneer de standaardprestaties moeten worden aangepast.

Hint

Een diverse set voorbeeldquery's verbetert de mogelijkheid van een Fabric-gegevensagent om nauwkeurige en relevante SQL/KQL-query's te genereren.

Als u voorbeeldquery's wilt toevoegen of bewerken, selecteert u de knop Voorbeeldquery's om het deelvenster Voorbeeldquery's te openen, zoals wordt weergegeven in de volgende schermopname:

Schermopname die laat zien waar u de voorbeelden kunt bewerken die u aan de AI verstrekt.

Dit deelvenster bevat opties voor het toevoegen of bewerken van voorbeeldquery's voor alle ondersteunde gegevensbronnen, behalve semantische Power BI-modellen en ontologieën. Voor elke gegevensbron kunt u Voorbeeldquery's toevoegen of bewerken selecteren om de relevante voorbeelden in te voeren, zoals wordt weergegeven in de volgende schermopname:

Schermopname van de SQL-voorbeelden die u aan de AI verstrekt.

Notitie

De Fabric-gegevensagent verwijst alleen naar query's die geldige SQL/KQL-syntaxis bevatten en die overeenkomen met het schema van de geselecteerde tabellen. De Fabric-gegevensagent gebruikt geen query's die de validatie nog niet hebben voltooid. Zorg ervoor dat alle voorbeeldquery's geldig en correct zijn afgestemd op het schema om ervoor te zorgen dat de Fabric-gegevensagent deze effectief gebruikt.

Een Fabric-gegevensagent publiceren en delen

Nadat u de prestaties van uw Fabric-gegevensagent hebt getest op verschillende vragen en u bevestigt dat er nauwkeurige SQL-, DAX- of KQL-query's worden gegenereerd, kunt u deze delen met uw collega's. Op dat moment selecteert u Publiceren, zoals wordt weergegeven in de volgende schermopname:

Schermopname van de publicatie van een Fabric-gegevensagent.

Met deze stap opent u een venster met een beschrijving van de Fabric-gegevensagent. Hier geeft u een gedetailleerde beschrijving van wat de Fabric-gegevensagent doet. Deze details begeleiden uw collega's over de functionaliteit van de Fabric-gegevensagent en helpen andere AI-systemen/orchestrators om de Fabric-gegevensagent effectief aan te roepen.

Nadat u de Fabric-gegevensagent hebt gepubliceerd, hebt u twee versies. Eén versie is de huidige conceptversie, die u kunt blijven verfijnen en verbeteren. De tweede versie is de gepubliceerde versie, die u kunt delen met uw collega's die een query willen uitvoeren op de Fabric-gegevensagent om antwoord te krijgen op hun vragen. U kunt feedback van uw collega's opnemen in uw huidige conceptversie tijdens het ontwikkelen, om de prestaties van de Fabric-gegevensagent verder te verbeteren.