Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Het doel van het cureren van een Genie-ruimte is het creëren van een omgeving waarin zakelijke gebruikers vragen in natuurlijke taal kunnen stellen en nauwkeurige, consistente antwoorden kunnen ontvangen op basis van hun gegevens. Genie spaces maken gebruik van geavanceerde modellen die geavanceerde query's genereren en algemene wereldkennis begrijpen.
De meeste zakelijke vragen zijn domeinspecifiek, dus de rol van een ruimtecurator is het overbruggen van de kloof tussen die algemene wereldkennis en de gespecialiseerde taal die wordt gebruikt in een specifiek domein of door een bepaald bedrijf. Curatoren gebruiken metagegevens en instructies om Genie te helpen vragen van zakelijke gebruikers nauwkeurig te interpreteren en erop te reageren. In dit artikel vindt u een overzicht van aanbevolen procedures en principes om u te begeleiden bij het ontwikkelen van een succesvolle ruimte.
Aanbevolen procedures voor het definiëren van een nieuwe ruimte
In de volgende secties worden procedures aanbevolen voor het maken van een effectieve ruimte.
Begin klein
Het cureren van een Genie-ruimte is een iteratief proces. Wanneer u een nieuwe ruimte maakt, begint u zo klein mogelijk, met minimale instructies en een beperkte set vragen die u kunt beantwoorden. Vervolgens kunt u toevoegen terwijl u itereert op basis van feedback en controle. Deze aanpak helpt bij het stroomlijnen van het maken en onderhouden van uw ruimte en stelt u in staat om deze effectief te cureren in reactie op de behoeften van echte gebruikers.
Gebruik de volgende richtlijnen om een kleine Genie-ruimte te maken:
- Blijf gefocust: neem alleen de tabellen op die nodig zijn om de vragen te beantwoorden waarvoor u de ruimte wilt gebruiken. Richt op vijf of minder tabellen. Hoe meer gericht uw selectie, hoe beter. Het beperken van uw ruimte op een kleine hoeveelheid gegevens is ideaal, dus beperk het aantal kolommen in uw opgenomen tabellen.
- Plan om te itereren: Begin met een minimale opzet voor uw ruimte, waarbij u zich richt op essentiële onderdelen en basisinstructies. Voeg meer gedetailleerde richtlijnen en voorbeelden toe wanneer u de ruimte na verloop van tijd verfijnt in plaats van te streven naar perfectie in eerste instantie.
- Bouwen op goed geannoteerde tabellen: Genie maakt gebruik van kolomnamen en beschrijvingen van Unity Catalog om antwoorden te genereren. Door kolomnamen en beschrijvingen te wissen, kunt u antwoorden van hoge kwaliteit produceren. Kolombeschrijvingen moeten nauwkeurige contextuele informatie bieden. Vermijd dubbelzinnige of onnodige details. Inspecteer door AI gegenereerde beschrijvingen voor nauwkeurigheid en duidelijkheid en gebruik ze alleen als ze overeenkomen met wat u handmatig zou opgeven.
Laat een domeinexpert de ruimte definiëren
Een effectieve ruimtemaker moet inzicht krijgen in de gegevens en de inzichten die ermee kunnen worden opgehaald. Gegevensanalisten die bekwaam zijn in SQL hebben doorgaans de kennis en vaardigheden om de ruimte te cureren.
Het doel van uw ruimte definiëren
Door de specifieke doelgroep en het doel van uw ruimte te identificeren, kunt u bepalen welke gegevens, instructies en testvragen u wilt gebruiken. Een ruimte moet vragen beantwoorden voor een bepaald onderwerp en een bepaald publiek, niet algemene vragen over verschillende domeinen. U kunt uw gegevenssets vereenvoudigen door vooraf aan tabellen te koppelen en overbodige kolommen te verwijderen voordat u gegevens toevoegt aan een ruimte. Wanneer u gegevens aan uw ruimte toevoegt, houdt u deze nauw gericht op het gedefinieerde doel van de ruimte. Verberg alle kolommen die verwarrend of onbelangrijk kunnen zijn. Zie Kolommen weergeven of verbergen.
Metagegevens en synoniemen toevoegen
U kunt kolom synoniemen en aangepaste beschrijvingen toevoegen aan gegevens in een Genie-ruimte. Deze metagegevens zijn gericht op uw Genie-ruimte en overschrijven geen metagegevens die zijn opgeslagen in Unity Catalog. Kwaliteitskolombeschrijvingen en synoniemen helpen Genie de kolom beter te begrijpen, deze te kiezen voor relevante vragen en nauwkeurigere SQL te schrijven. Zie Metagegevens van kolom bewerken.
Genie-gegevenssampling inschakelen
Belangrijk
Deze functie bevindt zich in openbare preview-versie.
Een werkruimtebeheerder kan Genie Data Sampling inschakelen voor uw werkruimte. Gegevenssampling verbetert de nauwkeurigheid van Genie door steekproeven uit gegevenssets in de ruimte te nemen, zodat gebruikersprompts beter overeenkomen met de juiste kolommen en waarden. Wanneer ingeschakeld, sampelt Genie automatisch waarden uit tabellen terwijl u de ruimte aanmaakt. U kunt beheren voor welke kolommen gegevens worden gesampled. Zie Gegevensobjecten beheren en waardesampling gebruiken om de nauwkeurigheid van Genie te verbeteren.
Geef gerichte voorbeelden en instructies op
Genie-ruimten presteren het beste met een beperkte, gerichte set instructies. Databricks raadt aan gebruik te maken van sql-voorbeeldquery's om instructies in uw omgeving te bieden. Met voorbeeld-SQL-query's kan Genie gebruikersprompts koppelen aan geverifieerde SQL-query's en leren van voorbeelden om gerelateerde vragen te beantwoorden. Zie Voorbeeld van SQL-query's en -functies toevoegen.
Voor context die wereldwijd in de Genie-ruimte moet worden toegepast, kan een kleine, goed georganiseerde set instructies voor tekst zonder opmaak ook helpen relevantie te behouden en de responskwaliteit te verbeteren. Te veel instructies kunnen de effectiviteit verminderen, vooral in langere gesprekken, omdat Genie moeite kan hebben om prioriteit te geven aan de belangrijkste richtlijnen. Zie Instructies opgeven voor meer informatie.
Testen en aanpassen
U moet de eerste gebruiker van uw ruimte zijn. Nadat u een nieuwe ruimte hebt gemaakt, begint u met het stellen van vragen. Bekijk zorgvuldig de SQL die is gegenereerd als antwoord op uw vragen. Als Genie de gegevens, vragen of bedrijfs jargon verkeerd interpreteert, kunt u tussenbeide komen door de gegenereerde SQL te bewerken of andere specifieke instructies op te geven. Blijf testen en bewerken totdat u betrouwbare antwoorden krijgt.
Nadat u een vraag hebt beoordeeld, kunt u deze toevoegen als een benchmarkvraag die u kunt gebruiken om uw ruimte systematisch te testen en te beoordelen voor de algehele nauwkeurigheid. U kunt variaties en verschillende formuleringen van vragen gebruiken om de reacties van Genie te testen. Zie Benchmarks gebruiken in een Genie-ruimte.
Zie Probleemoplossing voor ideeën over het oplossen van onjuiste antwoorden.
Gebruikerstest uitvoeren
Nadat de responskwaliteit is gecontroleerd door middel van testen, moet u een zakelijke gebruiker werven om de Genie-ruimte te proberen. Gebruik de volgende richtlijnen om een soepel gebruikerstraject te bieden en feedback te verzamelen voor doorlopende verbetering:
- Stel verwachtingen in dat hun taak is om de ruimte te verfijnen.
- Stel hen om hun test te richten op het specifieke onderwerp en vragen die de ruimte is ontworpen om te beantwoorden.
- Als ze een onjuist antwoord ontvangen, moedigt u gebruikers aan om aanvullende instructies en verduidelijkingen toe te voegen in de chat om het antwoord te verfijnen. Wanneer er een correct antwoord wordt gegeven, moeten ze de uiteindelijke vraag goedkeuren om vergelijkbare fouten in toekomstige interacties te minimaliseren.
- Vraag gebruikers om antwoorden omhoog of omlaag te stemmen met behulp van het ingebouwde feedbackmechanisme.
- Nodig gebruikers uit om extra feedback en onopgeloste vragen rechtstreeks met de auteurs van de ruimte te delen. Auteurs en editors kunnen feedback gebruiken om instructies, voorbeelden en vertrouwde assets te verfijnen.
Overweeg trainingsmateriaal of een geschreven document met richtlijnen voor het testen van de ruimte en het geven van feedback. Leid zakelijke gebruikers naar Een Genie-ruimte gebruiken om bedrijfsgegevens te verkennen om hen te helpen starten met werken in een nieuwe Genie-ruimte.
Terwijl zakelijke gebruikers de ruimte testen, kunnen ruimte-editors de vragen zien die ze hebben gesteld op het tabblad Bewaking . Blijf context toevoegen om Genie te helpen de vragen en gegevens correct te interpreteren om nauwkeurige antwoorden te geven. Zie De ruimte bewaken voor meer informatie over het bewaken van Genie-ruimten. U kunt ook controlelogboeken gebruiken om feedback over Genie ruimte te bewaken en verzoeken te beoordelen. Zie AI/BI-gebruik bewaken met auditlogboeken en waarschuwingen.
Notitie
Zakelijke gebruikers moeten lid zijn van de oorspronkelijke werkruimte om toegang te krijgen tot uw ruimte. Zie Vereiste machtigingen voor meer informatie over het opgeven van de juiste machtigingen voor interactie met de ruimte.
Probleemoplossinggids
In de volgende secties wordt beschreven hoe u veelvoorkomende problemen kunt oplossen.
Verkeerd begrepen bedrijfs jargon
De meeste bedrijven of domeinen hebben een specifieke afkorting die ze gebruiken om te communiceren over bedrijfsspecifieke gebeurtenissen. Als u bijvoorbeeld naar een jaar verwijst, betekent dit misschien altijd het fiscale jaar en kan dit fiscale jaar beginnen in februari of maart in plaats van januari. Om Genie in staat te stellen deze vragen natuurlijk en nauwkeurig te beantwoorden, moet u instructies opnemen die uw bedrijfsjargon expliciet toewijzen aan woorden en concepten die Genie kan begrijpen. Zie Instructies geven.
Onjuist tabel- of kolomgebruik
Als Genie gegevens probeert op te halen uit een onjuiste tabel of een analyse uitvoert op onjuiste kolommen, kunt u de gegevens op een van de volgende manieren aanpassen:
- Geef duidelijke en nauwkeurige beschrijvingen op: Controleer uw tabellen en de bijbehorende metagegevens om te controleren of de terminologie die daar wordt gebruikt, overeenkomt met de terminologie van de gebruikers in ingediende vragen. Als dat niet het geval is, verfijnt u de beschrijving of voegt u een instructie toe waarmee de terminologie die in de tabel wordt gebruikt, wordt toegewezen aan de terminologie die in de vraag wordt gebruikt.
- Voorbeeldquery's toevoegen: Geef voorbeeldquery's op die Genie kan gebruiken om te leren hoe u op bepaalde vragen kunt reageren. Zie Instructies geven.
- Verwijder tabellen of kolommen uit de ruimte: sommige tabellen bevatten mogelijk overlappende kolommen of concepten die het moeilijk maken voor Genie om te weten welke gegevens in een antwoord moeten worden gebruikt. Verwijder indien mogelijk onnodige of overlappende tabellen of kolommen. Om snel kolommen te verbergen in de gebruikersinterface van de Genie-ruimte, zonder de onderliggende gegevensobjecten te veranderen, raadpleegt u Kolommen weergeven of verbergen.
Filterfouten
Gegenereerde query's bevatten vaak een WHERE
component om resultaten te filteren op basis van een specifieke waarde. Als Genie geen inzicht heeft in de gegevenswaarden, kan de WHERE
component worden ingesteld om te filteren op de verkeerde waarde. Het kan bijvoorbeeld proberen om de naam 'Californië' te vinden wanneer de tabel afkortingen zoals 'CA' gebruikt.
Probeer voor dergelijke situaties een van de volgende strategieën:
- Indien nodig moet een werkruimtebeheerder Genie-gegevenssampling inschakelen vanaf de pagina Previews . Hierdoor kunnen functies waarmee Genie gebruikersprompts beter kan afstemmen op kolomwaarden. Zie Waardesampling gebruiken om de nauwkeurigheid van Genie te verbeteren.
- Controleer of voor relevante kolommen voorbeeldwaarden en waardewoordenlijsten zijn ingeschakeld. Als er nieuwe gegevens zijn toegevoegd aan relevante tabellen, vernieuwt u de waarden. Zie Kolommen weergeven.
Onjuiste koppelingen
Als foreign key-referenties niet zijn gedefinieerd in yourUnity Catalog, weet uw omgeving mogelijk niet hoe verschillende tabellen samen te voegen.
Probeer een of meer van de volgende oplossingen te implementeren:
- Definieer waar mogelijk vreemde sleutelverwijzingen in uw Unity Catalog. Zie CONSTRAINT clausule.
- Geef voorbeeldquery's op waarbij u tabellen op standaard manieren samenvoegt.
- Als de foreign key relaties van uw tabellen niet in uw Unity Catalog worden gespecificeerd, legt u deze vast in de instructies.
Als geen van deze oplossingen het probleem oplost, voegt u de tabel vooraf aan een weergave toe en gebruikt u deze als invoer voor de ruimte. Deze strategie is handig voor complexere joinscenario's, zoals self-joins.
Kolomopmerkingen worden niet gesynchroniseerd van vreemde tabellen
Azure Databricks beheert de metagegevens, gegevens of semantiek voor schrijfbewerkingen naar refererende tabellen niet. Afhankelijk van de brontabel zijn opmerkingen mogelijk niet toegankelijk vanuit Azure Databricks. Als u opmerkingen beschikbaar wilt maken, raadt Azure Databricks u aan een van de volgende handelingen uit te voeren:
- Bewerk kolommetagegevens in de gebruikersinterface van de Genie-ruimte. Bewerkte metagegevens zijn alleen van toepassing op de Genie-ruimte waar deze is geschreven. Zie Metagegevens van kolom bewerken.
- Maak een materiële weergave op basis van federatieve tabellen. U kunt opmerkingen toevoegen en bewerken in een gerealiseerde weergave zoals u dat zou doen in een beheerde tabel. U kunt deze weergave opnieuw gebruiken in meerdere Genie-ruimten. Zie Gegevens uit refererende tabellen laden met gerealiseerde weergaven voor meer informatie over het laden van gegevens uit refererende tabellen naar een gerealiseerde weergave. Zie Gerealiseerde weergaven voor meer informatie over het werken met gerealiseerde weergaven.
Problemen met metrische berekeningen
De manier waarop metrische gegevens worden berekend en samengevoegd, kan bijzonder complex zijn en veel zakelijke details omvatten die uw vakgebied niet begrijpt. Dit kan leiden tot onjuiste rapportage.
Probeer een of meer van de volgende oplossingen te implementeren:
- Als uw metrische gegevens worden samengevoegd vanuit basistabellen, geeft u voorbeelden van SQL-query's op die elke samengetelde waarde berekenen.
- Als uw metrische gegevens vooraf zijn berekend en zich in geaggregeerde tabellen bevinden, moet u dit uitleggen in tabelopmerkingen. Geef geldige aggregaties op voor elke metrische waarde als de metrische gegevens in die tabel verder kunnen worden samengeteld.
- Als de SQL die u probeert te genereren erg ingewikkeld is, probeer dan databaseweergaven te maken die al uw metrische gegevens voor uw omgeving hebben samengevoegd.
Onjuiste berekeningen op basis van tijd
Genie kan mogelijk niet altijd de tijdzone afleiden die wordt weergegeven in de gegevens of de tijdzone waarin uw analyse moet worden uitgevoerd, tenzij u expliciet aanvullende richtlijnen verstrekt.
Voeg meer expliciete instructies toe over de oorspronkelijke brontijdzone, de conversiefunctie en de doeltijdzone. In de volgende voorbeelden ziet u hoe u de algemene instructies voor betrouwbaardere tijdzoneconversies kunt wijzigen:
-
Altijd tijden converteren naar een specifieke tijdzone: in dit voorbeeld wordt ervan uitgegaan dat de tijdstempel van de bron
UTC
is en dat u resultaten in deAmerica/Los_Angeles
tijdzone wilt opnemen. Voeg het volgende toe aan de instructies en vervang<timezone-column>
door de juiste kolomnaam.- Tijdzones in de tabellen bevinden zich in
UTC
. - Converteer alle tijdzones met behulp van de volgende functie:
convert_timezone('UTC', 'America/Los_Angeles', <timezone-column>)
.
- Tijdzones in de tabellen bevinden zich in
-
Converteer niet-UTC-datum/tijd-notaties naar UTC: Als de standaardtijdzone van de werkruimte is
UTC
maar gebruikers in Los Angeles vandaag moeten verwijzen naar een specifieke set records, voegt u het volgende toe aan de algemene instructies van de ruimte:- Als u vandaag wilt verwijzen, gebruikt u 'date(convert_timezone('UTC', 'America/Los_Angeles', current_timestamp()))
Zie convert_timezone
functie voor meer informatie en syntaxis.
Instructies negeren
Zelfs als u uw tabellen en kolommen in commentaar hebt uitgelegd en algemene instructies hebt gegeven, wordt uw omgeving mogelijk nog steeds niet correct gebruikt.
Probeer een of meer van de volgende strategieën:
- Geef voorbeeldquery's op die uw tabellen correct gebruiken. Voorbeeldquery's zijn vooral effectief om uw omgeving te leren hoe u uw gegevens kunt gebruiken.
- Verberg irrelevante kolommen in de Genie-ruimte. Zie Kolommen weergeven of verbergen.
- Maak weergaven van uw tabellen die een eenvoudigere weergave van uw gegevens bieden.
- Bekijk uw instructies en probeer de ruimte te concentreren door irrelevante tabellen of instructies te verwijderen.
- Probeer een nieuwe chat te starten. Eerdere interacties kunnen invloed hebben op de reacties van Genie in een bepaalde chat, maar het starten van een nieuwe chat geeft u een leeg startpunt voor het testen van nieuwe instructies.
Prestatieproblemen
Wanneer Genie uitzonderlijk lange query's of tekstreacties moet genereren, kan het lang duren om te reageren of zelfs een time-out tijdens de denkfase.
Probeer een of meer van de volgende acties om de prestaties te verbeteren:
- Gebruik betrouwbare middelen of weergaven om complexe query's te encapsuleren. Zie Gebruik van vertrouwde assets in AI/BI Genie-ruimten.
- Verminder waar mogelijk de lengte van uw voorbeeldquery's voor SQL.
- Start een nieuwe chat als Genie trage of mislukte reacties begint te genereren.
Onbetrouwbare reacties op bedrijfskritieke vragen
Gebruik vertrouwde assets om geverifieerde antwoorden te geven op specifieke vragen die gebruikers verwachten te stellen. Zie Gebruik van vertrouwde assets in AI/BI Genie-ruimten.
Waarschuwing voor tokenlimiet
Tokens zijn de basiseenheden van tekst die Genie gebruikt om taal te verwerken en te begrijpen. Tekst die is opgenomen als instructies of metagegevens in een Genie-ruimte, wordt geconverteerd naar tokens. Als het aantal tokens in uw ruimte de limiet nadert, waarschuwt het product u met waarschuwingen. Genie past slimme contextfilters toe om de tokens te selecteren die de metagegevens vertegenwoordigen en sommige typen instructies die zijn opgenomen in de Genie-ruimte. Zelfs als u de limiet overschrijdt, moet de ruimte antwoorden op vragen blijven genereren.
Als uw Genie-ruimte de tokenlimiet nadert, kan Genie prioriteit geven aan het opnemen van alleen de onderdelen van uw tabelschema en de meest relevante instructies voor de vraag. Dit kan de responskwaliteit verminderen als belangrijke context wordt uitgefilterd. Houd rekening met de volgende procedures om het aantal tokens te verminderen:
- Overbodige kolommen verwijderen: onnodige kolommen in uw tabellen kunnen aanzienlijk bijdragen aan tokengebruik. Indien mogelijk, maakt u weergaven om overbodige of niet-essentiële velden uit uw onbewerkte tabellen uit te sluiten. U kunt overbodige kolommen ook verbergen in een Genie-ruimte. Zie Kolommen weergeven of verbergen.
-
Stroomlijn kolombeschrijvingen: hoewel kolombeschrijvingen belangrijk zijn, vermijdt u het dupliceren van informatie die al door kolomnamen wordt overgebracht. Als een kolom bijvoorbeeld een naam
account_name
heeft, kan een beschrijving zoals 'de naam van uw account' overbodig zijn en kunnen worden weggelaten. - Bewerk kolommetagegevens in de Genie-ruimte: Zie Kolommetagegevens bewerken voor meer informatie over het bewerken van beschrijvingen en het opgeven van synoniemen in kolommetagegevens.
- Sql-instructies verwijderen: neem een breed scala aan voorbeeld-SQL-instructies op om verschillende soorten vragen te behandelen, maar verwijder overlappende of redundante voorbeelden.
- Vereenvoudig de instructies: controleer of uw instructies duidelijk en beknopt zijn. Vermijd onnodige woorden.
Uw account is niet ingeschakeld voor cross-geo-verwerking
Genie is een Designated Service die wordt beheerd door Azure Databricks. Aangewezen Diensten gebruiken Databricks Geos voor het beheren van gegevensresidentie. Gegevens kunnen niet worden verwerkt in dezelfde geografische locatie als de werkruimte voor sommige regio's. Als uw werkruimte zich in een van deze regio's bevindt, moet cross-geo-verwerking worden ingeschakeld door uw accountbeheerder.
Doorvoerlimieten bereiken
Wanneer u Genie-ruimten opent via de Gebruikersinterface van Azure Databricks, is de doorvoer beperkt tot 20 vragen per minuut per werkruimte, in alle Genie-ruimten.
Wanneer u Genie-ruimten benadert via de gratis versie van de Conversation API (Public Preview), is de doorvoer beperkt tot een maximale inspanning van vijf vragen per minuut per werkruimte, over alle Genie-ruimten. Zie De Genie Conversation-API gebruiken om Genie te integreren in uw toepassingen.