Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Nasazení agenta AI na Mosaic AI Model Serving pomocí funkce deploy() z Agent Framework Python API. Nasazení vytvoří obslužný koncový bod s integrovanými nástroji pro škálovatelnost, monitorování a spolupráci.
Nasazený agent se automaticky integruje s možnostmi vyhodnocení a monitorování MLflow 3, včetně trasování v reálném čase, aplikace pro kontrolu zpětné vazby od stakeholderů a monitorování.
Requirements
MLflow 3
- Zaregistrujte agenta v katalogu Unity.
- Nainstalujte MLflow 3.1.3 nebo vyšší pro nasazení agentů pomocí
deploy()rozhraní API zdatabricks.agents. - Nasazení agentů mimo poznámkový blok Databricks vyžaduje
databricks-agentssadu SDK verze 1.1.0 nebo vyšší.
Nainstalujte požadavky:
# Install prerequisites
%pip install mlflow>=3.1.3 databricks-agents>=1.1.0
# Restart Python to make sure the new packages are picked up
dbutils.library.restartPython()
MLflow 2.x
Important
Databricks doporučuje použít MLflow 3 k nasazení agentů, protože některé funkce protokolování MLflow 2 budou zastaralé. Podívejte se na podrobné akce nasazení.
- Zaregistrujte agenta v katalogu Unity.
- Nainstalujte MLflow ve verzi 2.13.1 nebo vyšší, abyste mohli nasadit agenty prostřednictvím rozhraní API
deploy()zdatabricks.agents. - Nasazení agentů mimo poznámkový blok Databricks vyžaduje
databricks-agentsSDK verze 0.12.0 nebo vyšší.
Nainstalujte požadavky:
# Install prerequisites
%pip install mlflow>=2.13.1 databricks-agents>=0.12.0
# Restart Python to make sure the new packages are picked up
dbutils.library.restartPython()
Nasazení agentů pomocí deploy()
Nasazení agenta do koncového bodu obsluhujícího model:
from databricks import agents
deployment = agents.deploy(uc_model_name, uc_model_info.version)
# Retrieve the query endpoint URL for making API requests
deployment.query_endpoint
Když zavoláte deploy(), Databricks automaticky nastaví produkční infrastrukturu a integruje vašeho agenta s funkcemi AI genu MLflow následujícím způsobem:
Výstraha
Pokud nasazujete agenta z poznámkového bloku uloženého ve složce Databricks Git, trasování MLflow 3 v reálném čase nebude ve výchozím nastavení fungovat.
Pokud chcete povolit trasování v reálném čase, nastavte experiment na experiment nepřidružený k Gitu pomocí mlflow.set_experiment() a teprve poté spusťte agents.deploy().
Funkce deploy() ve výchozím nastavení provádí následující akce:
- Vytvoří model obsluhující koncový bod pro hostování agenta s automatickým škálováním a vyrovnáváním zatížení.
- Zřídí zabezpečené ověřování pro agenta pro přístup k podkladovým prostředkům.
- Umožňuje monitorování v reálném čase prostřednictvím trasování experimentů MLflow a automatizovaného hodnocení kvality v produkčním provozu.
- Nastaví spolupráci účastníků pomocí Review App pro sběr zpětné vazby.
Další informace najdete v tématu Podrobné akce nasazení.
Přizpůsobení nasazení
Předejte další argumenty k přizpůsobení nasazení pro deploy(). Můžete například povolit škálování na nulu pro nečinné koncové body předáním scale_to_zero_enabled=True. Tím se sníží náklady, ale zvýší se doba obsluhy počátečních dotazů.
Další parametry najdete v tématu Python API pro Databricks Agenty.
Načtení a odstranění nasazení agenta
Načíst nebo spravovat stávající nasazení agentů. Podívejte se na Python API agentů Databricks.
from databricks.agents import list_deployments, get_deployments, delete_deployment
# Print all current deployments
deployments = list_deployments()
print(deployments)
# Get the deployment for a specific agent model name and version
agent_model_name = "" # Set to your Unity Catalog model name
agent_model_version = 1 # Set to your agent model version
deployment = get_deployments(model_name=agent_model_name, model_version=agent_model_version)
# List all deployments
all_deployments = list_deployments()
# Delete an agent deployment
delete_deployment(model_name=agent_model_name, model_version=agent_model_version)
Ověřování pro závislé zdroje
Agenti se často potřebují autentizovat k jiným zdrojům, aby při jejich nasazení mohli dokončit úkoly. Například agent může potřebovat přístup k indexu vektorového vyhledávání pro dotazování na nestrukturovaná data.
Informace o metodách ověřování, včetně toho, kdy je použít a jak je nastavit, najdete v tématu Ověřování pro agenty AI.
Podrobné akce nasazení
Následující tabulka uvádí podrobné akce nasazení, které jsou výsledkem deploy() volání. Dokončení nasazení může trvat až 15 minut.
MLflow 3
deploy() akce |
Description |
|---|---|
| Vytvoření koncového bodu obsluhy modelu | Vytvoří škálovatelný koncový bod rozhraní REST API, který slouží vašemu agentu pro aplikace přístupné uživatelům s automatickým vyrovnáváním zatížení. |
| Zřízení zabezpečeného ověřování | Automaticky poskytuje krátkodobé přihlašovací údaje, které vašemu agentovi umožňují přístup k prostředkům spravovaným službou Databricks (indexy vektorového vyhledávání, funkce katalogu Unity atd.) s minimálními požadovanými oprávněními. Databricks ověří, že vlastník koncového bodu má před vydáním přihlašovacích údajů správná oprávnění a brání neoprávněnému přístupu. V případě jiných prostředků než Databricks předejte proměnné prostředí s tajnostmi do deploy(). Viz Konfigurace přístupu k prostředkům z modelů obsluhujících koncové body. |
| Povolit aplikaci pro kontrolu | Poskytuje webové rozhraní, ve kterém můžou účastníci komunikovat s vaším agentem a poskytovat zpětnou vazbu. Podívejte se na shromažďování zpětné vazby a očekávání označováním existujících stop. |
| Povolení trasování v reálném čase | Zaznamená všechny interakce agentů do experimentu MLflow v reálném čase a poskytuje okamžitou viditelnost monitorování a ladění.
|
| Povolení produkčního monitorování (beta verze) | Konfiguruje automatizované hodnocení kvality, které spouští hodnotící mechanismy v produkčním provozu. Podívejte se na monitorování v produkčním prostředí. |
| Povolení odvozovacích tabulek | Vytvoří tabulky, které protokolují vstupy a odpovědi pro auditování a analýzu.
|
| Protokolování požadavků rozhraní REST API a kontrola zpětné vazby k aplikacím | Zaznamenává požadavky rozhraní API a zpětnou vazbu do tabulky inferencí. Varování:Model zpětné vazby je zastaralý a v budoucí verzi se odebere. Upgradujte na MLflow 3 a místo toho použijte log_feedback rozhraní API. Viz Shromažďování názorů uživatelů.
|
MLflow 2
deploy() akce |
Description |
|---|---|
| Vytvoření koncového bodu obsluhy modelu | Vytvoří škálovatelný koncový bod rozhraní REST API, který slouží vašemu agentu pro aplikace přístupné uživatelům s automatickým vyrovnáváním zatížení. |
| Zřízení zabezpečeného ověřování | Automaticky poskytuje krátkodobé přihlašovací údaje, které vašemu agentovi umožňují přístup k prostředkům spravovaným službou Databricks (indexy vektorového vyhledávání, funkce katalogu Unity atd.) s minimálními požadovanými oprávněními. Databricks ověří, že vlastník koncového bodu má před vydáním přihlašovacích údajů správná oprávnění a brání neoprávněnému přístupu. V případě jiných prostředků než Databricks předejte proměnné prostředí s tajnostmi do deploy(). Viz Konfigurace přístupu k prostředkům z modelů obsluhujících koncové body. |
| Povolit aplikaci pro kontrolu | Poskytuje webové rozhraní, ve kterém můžou účastníci komunikovat s vaším agentem a poskytovat zpětnou vazbu. Podívejte se na shromažďování zpětné vazby a očekávání označováním existujících stop. |
| Povolení odvozovacích tabulek | Vytvoří tabulky, které protokolují vstupy a odpovědi pro auditování a analýzu. Varování: Protokoly žádostí a protokoly posouzení jsou zastaralé a v budoucí verzi se odeberou. Viz pokyny pro migraci v záznamech žádostí a ukončení podpory pro záznamy posouzení.
|
| Protokolování požadavků rozhraní REST API a kontrola zpětné vazby k aplikacím (zastaralé) | Zaznamenává požadavky rozhraní API a zpětnou vazbu do tabulky inferencí. Varování:Model zpětné vazby je zastaralý a v budoucí verzi se odebere. Upgradujte na MLflow 3 a místo toho použijte log_feedback rozhraní API. Viz Shromažďování názorů uživatelů.
|