Sdílet prostřednictvím


Použití agenta pro datové vědy

Důležité

Tato funkce je v beta verzi.

Na této stránce se seznámíte s agentem pro datové vědy a inteligencí, který je k dispozici výběrem režimu agenta v Nástroji Databricks Assistant. Navržený speciálně pro poznámkové bloky Databricks a Editor SQL, zkoumá data, generuje a spouští kód a opravuje chyby – to vše z jediné výzvy.

Co je agent pro datové vědy?

Data Science Agent je výkonná funkce v režimu agenta Databricks Assistantu, který transformuje Pomocníka na inteligentního společníka, který dokáže automatizovat celé pracovní postupy datových věd ve více krocích v poznámkových blocích Databricks a v editoru SQL.

Použijte agenta pro datové vědy v poznámkovém bloku.

V porovnání s režimem chatu asistenta má režim agenta rozšířené možnosti: plánování řešení, načítání relevantních prostředků, spouštění kódu, použití výstupů buněk ke zlepšení výsledků, oprava chyb automaticky a další.

Agent pro datové vědy může naplánovat a vygenerovat kód pro spuštění v poznámkových blocích nebo dotazech, které se mají spustit v editoru SQL. Agent s vámi spolupracuje na schválení svých plánů a před pokračováním potvrďte jeho další kroky. S vaším schválením může agent pro datové vědy používat nástroje k provádění úloh, jako je prohledávání tabulek, úpravy poznámkového bloku, spouštění buněk a čtení výstupů buněk.

Přístup a akce agenta pro datové vědy se řídí oprávněními uživatele. Může přistupovat pouze k datům, ke kterým máte přístup, a provádět operace, ke kterým máte oprávnění.

Požadavky

Pokud chcete použít agenta pro datové vědy, váš pracovní prostor potřebuje následující:

Použití agenta pro datové vědy

Použití agenta pro datové vědy:

  1. V poznámkovém bloku Databricks nebo v editoru SQL otevřete boční panel Pomocníka.

  2. V pravém dolním rohu vyberte Agent. Tím se zapne režim agenta asistenta, který umožňuje interakci s agentem pro datové vědy.

    Otevření agenta pro datové vědy

  3. Zadejte výzvu k zadání agenta. Například "Analyzovat @sales_transactions z samples.bakehouse k identifikaci nejprodávanějšího produktu".

    Návod

    Odkazovat na konkrétní tabulky pomocí .@table_name Agent použije tuto tabulku a všechna přidružená metadata ke kurátorované odpovědi. Agent respektuje oprávnění katalogu Unity uživatele, aby měl přístup jenom k datům, ke kterým máte přístup.

  4. Když agent generuje svou odpověď, často se pozastaví, aby získal váš vstup:

    • V případě složitějších úloh může agent vytvořit podrobný plán a klást objasňující otázky. Odpovězte na otázky agenta, které jí pomůžou vylepšit svůj plán.

    • Když agent potřebuje spustit kód, před pokračováním požádá o schválení. Povolit nebo odmítnout žádost. Můžete také vybrat možnost Povolit v tomto vlákně (odkazující na vlákno konverzace Asistenta) nebo Vždy povolit.

      Důležité

      Agent pro datové vědy může vygenerovat a spouštět kód v poznámkovém bloku. I když má mantinely, aby se zabránilo nebezpečným akcím, stále existuje riziko. Měli byste ho používat jenom s kódem a daty, kterým důvěřujete.

    • Vzhledem k tomu, že agent pokračuje v práci, může se zobrazit výzva k výběru možnosti Pokračovat nebo Odmítnout. Zkontrolujte stávající práci agenta a pak výběrem možnosti Pokračovat povolte agentovi pokračovat v dalších krocích nebo odmítnout a řekněte mu, aby zkusil něco jiného.

    • Pokud chcete agenta zastavit, když pracuje, klikněte na červenou ikonu Stop.

Agent může vytvářet nové buňky poznámkového bloku (nebo dotazy), generovat text a kód, spouštět buňky poznámkového bloku a přistupovat k výstupu buňky a interpretovat výsledky.

Poznámka:

Aby mohl agent pro datové vědy pokračovat v práci a provést další kroky, musíte zůstat na aktuální kartě, ve které agent pracuje.

Případy použití

V režimu agenta má Asistent rozšířené možnosti, jako je hledání dat, interpretace výstupů a provádění akcí buněk.

Data Science Agent může pomoct se složitými úlohami datových věd, včetně průzkumné analýzy dat, prognózy a strojového učení. Pomocí agenta pro datové vědy můžete dokonce vytvořit nový poznámkový blok analýzy dat od začátku. Pokud chcete dosáhnout lepších výsledků, poskytněte agentu kontext odkazováním na tabulky a kanály pomocí @<resource_name>. Můžete také kliknout na ikonu At. Odkazové zdroje pro ruční výběr kontextu, který chcete poskytnout.

Vyzkoušejte následující výzvy, abyste mohli začít:

  • Zjišťování dat:
    • "Která tabulka obsahuje data transakcí bakehouse?"
    • "Chci zobrazit data o počasí pro datum 2025-01-01 v Los Angeles, CA."
    • "Najděte tabulku obsahující data taxislužby New Yorku a ukažte mi prvních 10 řádků."
  • Průzkumná analýza dat:
    • "Pomozte mi analyzovat řetězec JSON ve sloupci A."
    • "Vytvoření vizualizace dat z této tabulky"
    • "Interpretovat tento pruhový graf."
    • "Popište datovou @sales_transactions sadu. Proveďte EDA, abyste mi pomohli pochopit statistiky sloupců a vizualizovat rozdělení hodnot. Myslete si jako datový vědec."
    • Analýza @workload_insights a zjištění 5 nejlepších zákazníků pro úlohy Sql Databricks za poslední týden podle výnosů Pak vykreslujte, kolik uživatelů měli tito zákazníci pro Databricks SQL za týden za posledních 6 týdnů."
  • Prognózování:
    • "Pomocí @incidents datové sady vytvořte prognózu denního počtu incidentů za příštích 2 týdny. Až budete hotovi, dejte mi tabulku dat a interaktivní graf, aby se zobrazily výsledky.
    • "Pomocí @website_traffic datové sady predikujte denní počty návštěvníků pro nadcházející měsíc. Zvýrazněte všechny sezónní vzory."
    • "Vygenerování prognózy poptávky po produktech za příštích 6 měsíců z @inventory datové sady, včetně intervalů spolehlivosti."
  • Strojové učení:
    • "Příprava dat a příprava funkcí pro přípravu této datové sady na trénování modelu"
    • Trénování klasifikačního modelu v @customer_data datové sadě za účelem predikce četnosti změn Vyhodnoťte model s přesností a metrikami AUC."
    • "Ladění hyperparametrů u regresního modelu pomocí @housing_prices datové sady za účelem zlepšení chyby předpovědi."
    • Sestavení modelu clusteringu v @sales_leads datové sadě pro identifikaci segmentů zákazníků a poskytnutí souhrnu charakteristik jednotlivých clusterů
  • Organizace poznámkového bloku:
    • "Vytvořte novou buňku, která shrnuje výsledky z tohoto poznámkového bloku."
    • "Dejte tomuto poznámkovému bloku relevantní název.".

Průzkumná analýza dat

Pomocí data science agenta můžete provádět průzkumnou analýzu dat v datové sadě. Zkuste například pomocí agenta vytvořit nový poznámkový blok, který analyzuje samples.bakehouse.sales_transactions datovou sadu.

V prázdném listu poznámkového bloku otevřete panel Asistent, vyberte režim Agent a zadejte následující výzvu: "Popište datovou sadu z @sales_transactions samples.bakehouse. Chci udělat nějaké EDA, abych porozuměl statistikám sloupců a vizualizoval rozdělení hodnot. Myslete si jako datový vědec."

Data Science Agent vytvoří poznámkový blok pro EDA.

Agent vytvoří plán, který bude odpovídat na vaši výzvu a může klást objasňující otázky. Se schválením vygeneruje nové buňky poznámkového bloku, které obsahují kód pro zkoumání dat a textu, které vysvětlují jeho proces a zjištění.