Share via


Genie Code gebruiken voor data science

Op deze pagina maakt u kennis met Genie Code voor gegevenswetenschap. Met name ontworpen voor Databricks-notebooks en de SQL-editor, kan Genie Code in de agentmodus gegevens verkennen, code genereren en uitvoeren en fouten oplossen, allemaal vanaf één prompt.

Wat is Genie Code voor data science?

De agentmodus van Genie Code kan volledige data science-werkstromen in meerdere stappen automatiseren in Databricks-notebooks en de SQL-editor.

Gebruik de Data Science Agent in een notebook.

Vergeleken met de modus Genie Code Chat heeft de agentmodus uitgebreide mogelijkheden: een oplossing plannen, relevante assets ophalen, code uitvoeren, celuitvoer gebruiken om resultaten te verbeteren, fouten automatisch op te lossen en meer.

Genie Code kan code plannen en genereren die moet worden uitgevoerd in notebooks of query's die moeten worden uitgevoerd in de SQL-editor. Genie Code werkt met u mee om de plannen goed te keuren en de volgende stappen te bevestigen voordat u doorgaat. Met uw goedkeuring kan Genie Code hulpprogramma's gebruiken om taken uit te voeren, zoals het doorzoeken van tabellen, het bewerken van een notebook, het uitvoeren van cellen en het lezen van celuitvoer.

De toegang en acties van Genie Code worden beheerd door de machtigingen van de gebruiker. Het heeft alleen toegang tot gegevens waartoe u toegang hebt en bewerkingen uitvoert waarvoor u machtigingen hebt.

Requirements

Als u de agentische data science-mogelijkheden van Genie Code wilt gebruiken, heeft uw werkruimte het volgende nodig:

Genie Code gebruiken voor data science

Genie Code gebruiken voor data science-taken:

  1. Open het zijpaneel van Genie Code vanuit een Databricks-notebook of de SQL-editor.

  2. Selecteer Agent in de rechterbenedenhoek. Hiermee schakelt u de agentmodus van Genie Code in, zodat u kunt communiceren met de agentische data science-mogelijkheden.

    Open Data Science Agent

  3. Voer een prompt in voor Genie Code. Bijvoorbeeld 'Analyseren @sales_transactions van samples.bakehouse om het best verkopende product te identificeren'.

    Aanbeveling

    Verwijzen naar specifieke tabellen met behulp van @table_name. De agent gebruikt die tabel en eventuele bijbehorende metagegevens om het antwoord te cureren. De agent respecteert de Unity Catalog-machtigingen van de gebruiker, zodat deze alleen toegang heeft tot de gegevens waartoe u toegang hebt.

  4. Terwijl Genie Code het antwoord genereert, wordt het vaak onderbroken om uw invoer op te halen:

    • Voor complexere taken kan Genie Code een stapsgewijs plan maken en vragen stellen. Beantwoord de verduidelijkende vragen om het plan te verfijnen.

    • Wanneer Genie Code code moet uitvoeren, wordt u gevraagd om goedkeuring voordat u doorgaat. De aanvraag toestaan of weigeren . U kunt ook Toestaan selecteren in deze thread (verwijzend naar Genie Code-gespreksthread) of Altijd toestaan.

      Belangrijk

      Genie Code kan code genereren en uitvoeren in uw notebook. Hoewel het vangrails heeft om gevaarlijke acties te voorkomen, is er nog steeds risico. U moet deze alleen gebruiken met code en gegevens die u vertrouwt

    • Als Genie Code verdergaat met het werk, wordt u mogelijk gevraagd om Doorgaan of Weigeren te selecteren. Controleer het bestaande werk van Genie Code en selecteer Vervolgens Doorgaan om door te gaan met de volgende stappen of Weigeren om te vertellen dat het iets anders moet proberen.

    • Als u Genie Code wilt stoppen terwijl deze werkt, klikt u op het rode stoppictogram..

Genie Code kan nieuwe notebookcellen (of query's) maken, tekst en code genereren, de notebookcellen uitvoeren en de celuitvoer openen om de resultaten te interpreteren.

Opmerking

Om Genie Code verder te laten werken en de volgende stappen uit te voeren, moet u op het huidige tabblad blijven waar de code in werkt.

Aanbeveling

U kunt instructies voor Genie Code toevoegen in de agentmodus voor gebruik in de meeste antwoorden. Als u bijvoorbeeld codeconventies of voorkeursbibliotheken hebt die u wilt gebruiken, kunt u deze richtlijnen toevoegen aan instructies voor Genie Code. U kunt ook vaardigheden maken om Genie Code uit te breiden met gespecialiseerde mogelijkheden voor uw domeinspecifieke taken. Zie Tips voor het verbeteren van Genie Code-antwoorden voor meer informatie en andere tips.

Gebruikssituaties

In de agentmodus heeft Genie Code uitgebreide mogelijkheden, zoals het zoeken van gegevens, het interpreteren van uitvoer en het uitvoeren van celacties.

Genie Code kan helpen bij complexe gegevenswetenschapstaken, waaronder verkennende gegevensanalyse, prognose en machine learning. U kunt zelfs een volledig nieuw notebook voor gegevensanalyse maken met Genie Code. Voor betere resultaten geeft u de agent context door te verwijzen naar tabellen, pijplijnen, notebooks, query's en bestanden met @<resource_name>. U kunt ook op Bij het pictogram klikken Voeg context toe om handmatig de context te selecteren die u wilt opgeven. Elke referentieasset blijft opgeslagen in de chatcontext.

Probeer de volgende aanwijzingen om aan de slag te gaan:

  • Gegevensdetectie:
    • "Welke tabel bevat bakehouse-transactiegegevens?"
    • "Ik wil de weergegevens zien voor de datum 2025-01-01 in de stad Los Angeles, CA."
    • "Zoek een tabel die taxigegevens van New York City bevat en laat me de eerste 10 rijen zien."
  • Verkennende gegevensanalyse:
    • "Help me de JSON-tekenreeks te parseren in kolom A."
    • 'Een visualisatie maken van de gegevens uit deze tabel'.
    • 'Dit staafdiagram interpreteren'.
    • 'Beschrijf de @sales_transactions gegevensset. Voer een aantal EDA uit om inzicht te verkrijgen in de kolomstatistieken en de verdeling van waarden te visualiseren. Denk als een data scientist."
    • "Analyseer @workload_insights om de top 5 klanten te vinden voor Databricks SQL-workloads afgelopen week op basis van omzet. Plot vervolgens hoeveel gebruikers die klanten hadden voor Databricks SQL per week voor de afgelopen 6 weken.
  • Prognoses:
    • "Met behulp van de @incidents gegevensset bouwt u een prognose van het dagelijkse aantal incidenten voor de komende 2 weken. Als u klaar bent, geeft u mij een gegevenstabel en een interactieve grafiek om de resultaten weer te geven.
    • "Met behulp van de @website_traffic gegevensset voorspelt u het aantal dagelijkse bezoekers voor de komende maand. Markeer eventuele seizoensgebonden patronen."
    • "Genereer een prognose van de productvraag voor de komende 6 maanden van de @inventory gegevensset, inclusief betrouwbaarheidsintervallen."
  • Machine learning:
    • "Voer een aantal gegevensvoorbereiding en functie-engineering uit om deze gegevensset voor te bereiden voor modeltraining."
    • Train een classificatiemodel op de @customer_data dataset om klantverloop te voorspellen. Evalueer het model met nauwkeurigheid en metrische AUC-gegevens.
    • "Hyperparameterafstemming uitvoeren op een regressiemodel met behulp van de gegevensset om de @housing_prices voorspellingsfout te verbeteren."
    • "Bouw een clusteringmodel op de @sales_leads gegevensset om klantsegmenten te identificeren en een samenvatting te geven van de kenmerken van elk cluster."
  • Notitieblokorganisatie:
    • 'Maak een nieuwe cel met een overzicht van de resultaten van dit notitieblok'.
    • Geef dit notitieblok een relevante naam.

Verkennende gegevensanalyse

Gebruik Genie Code om verkennende gegevensanalyse uit te voeren op een gegevensset. Probeer het bijvoorbeeld te vragen om u te helpen een nieuw notitieblok te maken waarmee de samples.bakehouse.sales_transactions gegevensset wordt geanalyseerd.

Open het deelvenster Genie Code op een leeg notitiebloktabblad, selecteer agentmodus en voer de volgende prompt in: 'Beschrijf de gegevensset, @sales_transactions uit samples.bakehouse. Ik wil wat EDA doen, zodat ik de kolomstatistieken begrijp en de verdeling van waarden kan visualiseren. Denk als een data scientist."

Data Science Agent maakt een notebook voor EDA.

De agent maakt een plan om uw prompt te beantwoorden en kan verduidelijkende vragen stellen. Met uw goedkeuring worden nieuwe notebookcellen gegenereerd die code bevatten om de gegevens en tekst te verkennen waarmee het proces en de bevindingen worden uitgelegd.