Sdílet prostřednictvím


Koncepty: Generování umělé inteligence v Azure Databricks

Aplikace GenAI je aplikace, která používá generující modely AI (například velké jazykové modely, modely generování obrázků a modely převodu textu na řeč) k vytváření nových výstupů, automatizaci složitých úloh nebo zapojení do inteligentních interakcí na základě uživatelského vstupu.

Aplikace GenAI může být poháněná jednoduchými voláními LLM nebo jiných modelů GenAI, nebo komplexními AI agenty. Přečtěte si další informace o úrovních složitosti.

Agenti, nástroje, hodnocení, modely a další aspekty aplikací GenAI se dají přizpůsobit vašimi proprietárními daty. Toto přizpůsobení řízené daty vede k datové inteligenci, což vám umožní překonat obecnou inteligenci nabízenou předpřipravenými modely AI.

Aplikace GenAI

Aplikace GenAI, která je přístupná uživatelem, může mít mnoho forem, například:

Úspěch s aplikacemi GenAI často vyžaduje dvě sady dovedností: vývoj aplikací a hodnocení AI. Vývoj aplikací GenAI se podobá vývoji aplikací bez AI, což vyžaduje softwarové dovednosti, které závisí na typu aplikace. Vyhodnocení aplikací GenAI ale vyžaduje specializované nástroje a techniky pro zvládnutí složitosti a otevřených odpovědí z GenAI.

Další informace o vytváření aplikací GenAI specifických pro konkrétní odvětví v Azure Databricks najdete v tématu:

Vyhodnocení GenAI

Modely GenAI, agenti a aplikace mají často složité otevřené chování. Uživatelé můžou zadat libovolný dotaz. Agent umělé inteligence může během provádění shromažďovat text, obrázky a další. Výstupem může být libovolný text, obrázky nebo jiné médium a může existovat mnoho "dobrých" odpovědí.

Díky těmto komplikacím je obtížné vyhodnotit GenAI. Správné vyhodnocení vyžaduje:

  • Automatizace s využitím AI k vyhodnocení AI
  • Lidská zpětná vazba od odborníků a uživatelů za účelem sběru skutečných dat a kalibrování automatického hodnocení
  • Hluboká analýza složitých agentů pro pochopení a ladění jejich chování

MLflow spravovaný službou Azure Databricks a související nástroje poskytují základy pro vyhodnocení GenAI:

Agents

Agent nebo systém agenta je systém řízený AI, který může nezávisle vnímat, rozhodovat a jednat v prostředí za účelem dosažení cílů. Na rozdíl od samostatného modelu GenAI, který vytvoří výstup po poskytnutí výzvy, má systém agentů určitou míru autonomie. Moderní agenti umělé inteligence používají model GenAI jako "mozek" systému, který:

  1. Přijímá žádosti uživatelů nebo zprávy od jiného agenta.
  2. Důvody, jak pokračovat: jaká data se mají načíst, jakou logiku použít, které nástroje se mají volat, nebo jestli se má požadovat další vstup od uživatele.
  3. Spustí plán a případně použije různé nástroje nebo deleguje na podagenty.
  4. Vrátí odpověď nebo vyzve uživatele k dalšímu objasnění.

Přemostěním obecných inteligentních funkcí (předem natrénovaných funkcí modelu GenAI) a datových inteligentních funkcí (specializované znalosti a rozhraní API specifické pro vaši firmu) umožňují systémy agentů vysoce ovlivněné případy podnikového použití, jako jsou pokročilé toky zákaznických služeb, analytické roboty s bohatými daty a orchestrace více agentů pro složité provozní úlohy.

Existuje kontinuum od jednoduchých modelů GenAI až po komplexní agenty. Další informace najdete v tématu Vzory návrhu systému agenta.

Azure Databricks nabízí celou řadu možností pro sestavování agentů, od plně vedeného po zcela přizpůsobeného.

  • AI Playground poskytuje uživatelské rozhraní pro vytváření prototypů agentů pro volání nástrojů, ze kterých můžete exportovat vygenerovaný kód agenta.
  • Agent Framework umožňuje vytvářet a nasazovat agenty pomocí vlastního kódu nebo knihoven pro vytváření agentů třetích stran.

Nástroje

Agenti umělé inteligence můžou volat nástroje pro shromažďování informací nebo provádění akcí. Nástroje jsou funkce s jednou interakcí, které LLM může vyvolat za účelem dosažení dobře definované úlohy. Model AI obvykle generuje parametry pro každé volání nástroje a nástroj poskytuje přímou interakci se vstupem a výstupem.

Mezi běžné kategorie nástrojů patří:

  • nástroje , které načítají nebo analyzují data
    • Sémantické načítání: Dotazování vektorového indexu pro vyhledání relevantního textu nebo jiných nestrukturovaných dat
    • Strukturované načítání: Spouštění dotazů SQL nebo použití rozhraní API k načtení strukturovaných informací
    • Nástroj pro vyhledávání na webu: Vyhledejte internet nebo interní webový korpus.
    • Klasické modely ML: Volání modelů strojového učení za účelem provádění klasifikace, regrese nebo jiných předpovědí
    • Modely GenAI: Generují specializované výstupy, jako je kód nebo obrázky.
  • nástroje , které upravují stav externího systému
    • Volání rozhraní API: Volání koncových bodů CRM, interních služeb nebo jiných integrací třetích stran
    • Integrace e-mailové aplikace nebo aplikace pro zasílání zpráv: Odešlete zprávu nebo odešlete oznámení.
  • Nástroje, které spouštějí logiku nebo provádějí konkrétní úlohu
    • Provádění kódu: Spusťte kód vygenerovaný uživatelem nebo LLM v sandboxu.

Nástroje je možné integrovat do agentské logiky nebo přistupovat pomocí standardizovaných rozhraní, jako je MCP.

Nástroje vs. agenti:

  • Nástroje provádějí jednu dobře definovanou operaci. Agenti můžou provádět více otevřených úloh.
  • Nástroje jsou obecně bezstavové a neudržují trvalý kontext nad rámec každého vyvolání. Agenti udržují stav při iterativním řešení úloh.

Zpracování chyb a bezpečnost nástrojů:

Vzhledem k tomu, že každé volání nástroje je externí operace, jako je volání rozhraní API, měl by systém řádně zpracovávat selhání. Vypršení časového limitu, poškozené odpovědi nebo neplatné vstupy by neměly způsobit úplné selhání agenta. V produkčním prostředí omezte počet povolených volání nástroje, mějte záložní odpověď, pokud volání nástroje selže, a použijte ochranná opatření, aby se systém agenta opakovaně nepokusil o stejnou neúspěšnou akci.

Další informace o nástrojích AI v Databricks:

Modely GenAI a LLM

Velké jazykové modely (LLM) jsou modely AI natrénované na masivních textových datových sadách, které dokážou porozumět, generovat a zdůvodnění lidského jazyka. Aplikace jako chatboti, asistenti pro psaní kódu a nástroje pro generování obsahu využívají LLM k predikci a produkci kontextově relevantního textu na základě vstupních podnětů.

Obecněji se modely GenAI nebo základní modely trénují na rozsáhlých textech, obrázcích, videích, zvukových nahrávkách nebo jiných datech, aby se dozvěděly o modech nad rámec textu. Multimodální modely se učí propojit lidský jazyk s obrázky, zvukem a dalšími multimédii. LLM jsou typem GenAI nebo základního modelu, i když se tyto termíny často používají volně a zaměnitelně.

Modely GenAI poskytují inteligentní informace o agentech a aplikacích GenAI. Jednoduché aplikace se často vytvářejí pomocí jediného modelu přizpůsobeného pomocí úpravy vstupních příkazů.

Seznamte se s používáním modelů GenAI v Azure Databricks:

Inženýrství podnětů

Modely GenAI obvykle posílají výzvy nebo pokyny, které modelu říkají, jak zpracovat uživatelský vstup. Výzvy se dají výrazně přizpůsobit podrobnými kroky, odbornými znalostmi, daty a dalšími informacemi.

Azure Databricks nabízí flexibilní způsoby, jak provádět prompt engineering. Například:

  • Agent Bricks automatizuje návrh promptů na pozadí, na základě vašich dat a zpětné vazby.

Jemné ladění modelů

Modely GenAI je také možné přizpůsobit prostřednictvím jemného ladění, které přizpůsobí model pro konkrétní doménu nebo aplikaci pomocí vlastních dat.

Azure Databricks nabízí flexibilní způsoby vyladění modelů. Například:

Co je platforma GenAI?

GenAI vyžaduje kombinovanou platformu dat a AI. Pro vývojáře i správce musí být klíčové komponenty GenAI připojené a řízené v jednoduché sjednocené platformě.

Mezi klíčové komponenty patří:

  • Prostředky AI, jako jsou modely, agenti a aplikace
  • Datové prostředky, jako jsou soubory, tabulky, zpracovatelské kanály, vektorové indexy a úložiště prvků
  • Nasazení AI, jako jsou koncové body pro modely a agenty
  • Nástroje pro sestavování a nasazování AI a datových prostředků

Mezi klíčové možnosti zásad správného řízení patří:

Také se podívejte na schopnosti Mosaic AI pro GenAI a architekturu Databricks.

Další informace