Sdílet prostřednictvím


Použijte kód Genie pro vývoj datových kanálů

Důležité

Tato funkce je ve verzi Public Preview.

Tato stránka představuje Genie Code pro vývoj datových toků, což je agent AI pro práci s daty, dostupný výběrem režimu agenta v Genie Code. Navržené speciálně pro Deklarativní kanály Lakeflow Spark (SDP) a Editor Lakeflow kanálů, zkoumá data, generuje a spouští kód kanálu a opravuje chyby z jediné výzvy.

Co je vývojářský nástroj Genie Code pro tvorbu pipelines?

Genie Code v režimu agenta je autonomní partner, který dokáže automatizovat celé pracovní postupy přípravy dat ve více krocích v SDP a Editoru kanálů Lakeflow.

Použijte agenta přípravy dat.

V porovnání s chatovým režimem Genie Code má režim agenta rozšířené možnosti: plánování řešení, načítání relevantních prostředků, spouštění kódu, použití výstupů kanálu ke zlepšení výsledků, oprava chyb automaticky a další.

Genie Code v režimu agenta může plánovat a generovat kompletní kanály od začátku nebo urychlit práci na existujícím kanálu. Agent s vámi spolupracuje na schválení svých plánů a před pokračováním potvrdí další kroky. S vaším schválením může Genie Code používat nástroje k provádění úloh, jako je prohledávání tabulek, úprava zdrojového souboru SQL nebo Pythonu, spouštění aktualizací kanálu a čtení datových sad kanálu.

Přístup a akce Genie Code se řídí oprávněními uživatele. Může přistupovat pouze k datům, ke kterým máte přístup, a provádět operace, ke kterým máte oprávnění.

Poznámka:

Když v Genie Code zapnete režim agenta, Genie Code přizpůsobí jeho schopnosti na základě funkcí, které aktuálně používáte v Databricks. Například v Editoru kanálů Lakeflow se Genie Code zaměřuje na úpravy kanálů a úlohy přípravy dat. V poznámkových blocích a editoru SQL podporuje Genie Code zkoumání a analýzu dat. Další informace najdete v tématu Použití kódu Genie pro datové vědy .

Požadavky

Pokud chcete použít Genie Code pro přípravu dat, váš pracovní prostor potřebuje následující:

Použití kódu Genie pro vývoj pipeline kanálů

Použití agentních schopností Genie Code pro vývoj pipeline:

  1. V Editoru kanálů Lakeflow otevřete boční panel Genie Code kliknutím na ikonu Asistent avatara.Genie Code v pravém horním rohu pracovního prostoru.

  2. V pravém dolním rohu vyberte Agent. Tím se zapne režim agenta Genie Code, což vám umožní využívat schopnosti pro agentickou přípravu dat Genie Code.

  3. Zadejte výzvu k zadání kódu Genie. Můžete se například zeptat na svůj kanál, například "popsat tento kanál". Můžete ji také požádat o přidání nových datových sad, například "vytvořte silver_sales_data v novém souboru, který čte z bronze_sales_data a vyčistí data a přidá užitečná kvalitativní očekávání."

    Poznámka:

    Genie Code respektuje oprávnění uživatele v Unity Catalogu, takže má přístup pouze k datům a zdroji datového kanálu, ke kterým máte přístup.

  4. Když Genie Code vygeneruje svou odpověď, často se pozastaví, aby získal váš vstup:

    • V případě složitějších úkolů může Genie Code vytvořit podrobný plán a položit si jasné otázky. Odpovězte na své objasňující otázky, které jí pomůžou vylepšit svůj plán.

    • Když Genie Code potřebuje spustit kód nebo aktualizovat kanál, před pokračováním požádá o schválení. Povolit nebo odmítnout žádost. V tomto vlákně můžete také vybrat Možnost Povolit (odkazující na vlákno konverzace Genie Code) nebo Vždy povolit.

      Důležité

      Genie Code v režimu agenta umožňuje generování a spuštění kódu ve vašem procesním řetězci. I když má mantinely, aby se zabránilo nebezpečným akcím, stále existuje riziko. Měli byste ho používat jenom s daty, kterým důvěřujete, a před spuštěním byste měli zkontrolovat kód.

    • Vzhledem k tomu, že Genie Code pokračuje ve své práci, můžete být vyzváni k výběru možnosti Pokračovat nebo Odmítnout. Zkontrolujte stávající práci a pak vyberte Pokračovat , abyste mohli pokračovat v dalších krocích, nebo odmítnout a řekněte mu, aby zkusil něco jiného.

    • Pokud chcete zastavit Genie Code během práce, klikněte na červenou ikonu Stop..

Genie Code může vytvářet nové soubory, generovat text, dotazy a kód, spouštět soubory nebo kanály a přistupovat k výstupním datovým sadám pro interpretaci výsledků.

Poznámka:

Aby mohl Genie Code pokračovat v práci a přijmout další kroky, je třeba zůstat na aktuální kartě, na které pracuje.

Návod

Do většiny odpovědí můžete přidat pokyny pro Genie Code. Pokud máte například konvence kódu, které chcete použít, nebo upřednostňované knihovny, které chcete použít, můžete tyto pokyny přidat do pokynů pro Genie Code. Můžete také vytvořit dovednosti pro rozšíření Genie Code se specializovanými možnostmi pro úlohy specifické pro vaši doménu. Další podrobnosti a další tipy najdete v tématu Tipy pro vylepšení odpovědí genie Code.

Capabilities

V režimu agenta může Genie Code pomoct s většinou úloh vývoje pipeline. Mezi klíčové funkce patří:

  • Zjišťování dat: Genie Code může prohledávat tabulky v pracovním prostoru, aby vám pomohl najít požadovaná data pro úlohu.
  • Úpravy kódu pipeline: Genie Code může současně vytvářet a upravovat více souborů. Bude vás informovat o tom, které soubory se mění, a zobrazí rozdíl kódu v jednotlivých souborech, takže změny můžete zkontrolovat jednotlivě nebo všechny společně na konci.
  • Spuštění pipeline: Genie Code může spouštět jednotlivé soubory, testovací spuštění/spustit pipeline, nebo provést úplnou aktualizaci. Když chce Genie Code pokračovat, před tím se vás zeptá na potvrzení.
  • Porozumění a zlepšení chování kanálu: Genie Code může zkoumat datové sady a výstupy kanálu, které vám pomůžou pochopit, co kanál dělá uceleně a proč. Může například shrnout transformace, sledovat tok dat do podřízených tabulek a zvýraznit neočekávané změny počtu řádků nebo schémat. Když se objeví potenciální problémy s kvalitou dat, může vám Genie Code pomoct zdůvodnit jejich příčinu a navrhnout, kde a jak je řešit v kanálu.

Tyto funkce podporují běžné případy použití, například:

  • Vytvoření nového kanálu: Genie Code vám může pomoct se všemi kroky vytvoření nového kanálu architektury medallionu od ingestování dat až po standardizaci a čištění dat až po transformaci a analýzu dat.
  • Vysvětlit potrubí: Genie Code dokáže analyzovat a vysvětlit stávající potrubí, aby vám pomohl rychle se seznámit s procesem.
  • Řešení problémů: Pokud máte chyby, může Genie Code pomoct diagnostikovat a opravit problémy, iterace prostřednictvím více souborů, dokud se problém nevyřeší.

Examples

Vyzkoušejte následující výzvy, abyste mohli začít:

  • Postavit a spustit rouru architektury Medallion pro detekci podvodů pomocí tabulek Transactions a Customers v my_catalog.my_schema.
  • Vysvětlete každý krok tohoto procesu.
  • "Oprava selhání v tomto kanálu."

Další kroky