Poznámka
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Na této stránce se dozvíte, jak ladit běžné problémy při nasazování agentů AI pomocí API Agent Frameworku Mosaic AI agents.deploy()
.
Agent Framework se nasadí do koncových bodů obsluhy modelů, takže byste měli kromě kroků ladění agenta na této stránce zkontrolovat průvodce laděním pro obsluhu modelu .
Navrhování agentů s využitím osvědčených postupů
Při vytváření agentů použijte následující osvědčené postupy:
- Vylepšete ladění pomocí doporučených rozhraní pro vývoj agentů a trasování MLflow: Dodržujte nejlepší postupy v autorizaci AI agentů v kódu, jako je povolení automatického logování trasování MLflow, aby bylo ladění agentů snadnější.
- Jasně zdokumentujte nástroje: Jasné popisy nástrojů a parametrů zajistí, že váš agent rozumí vašim nástrojům a správně je používá. Podívejte se na vylepšení volání nástrojů pomocí jasné dokumentace.
-
Přidání časových limitů a limitů tokenů pro volání LLM: Přidejte do kódu časové limity a limity tokenů, abyste zabránili zpožděním způsobeným dlouhotrvajícími kroky.
- Pokud váš agent používá klienta OpenAI k dotazování na koncový bod služby Databricks LLM, nastavte vlastní časové limity při volání na koncové body podle potřeby.
Ladění pomalých nebo neúspěšných požadavků na nasazené agenty
Pokud jste při vytváření agenta povolili automatické protokolování trasování MLflow , trasování se automaticky zaprotokoluje v tabulkách odvozování. Tyto stopy mohou pomoci identifikovat komponenty agenta, které jsou pomalé nebo selhávají.
Identifikace problematických požadavků
Při hledání problematických požadavků postupujte takto:
- V pracovním prostoru přejděte na kartu Obsluha a vyberte název nasazení.
- V části Odvozovací tabulky vyhledejte plně kvalifikovaný název tabulky odvození. Například:
my-catalog.my-schema.my-table
. - V poznámkovém bloku Databricks spusťte následující příkaz:
%sql SELECT * FROM my-catalog.my-schema.my-table
- Podrobné informace o trasování najdete ve sloupci Odpověď .
- Filtrovat podle
request_time
,databricks_request_id
nebostatus_code
a zúžit výsledky.%sql SELECT * FROM my-catalog.my-schema.my-table WHERE status_code != 200
Analýza problémů s původní příčinou
Po identifikaci neúspěšných nebo pomalých požadavků použijte rozhraní API mlflow.models.validate_serving_input k vyvolání agenta proti neúspěšné vstupní žádosti. Pak si prohlédněte výsledné trasování a proveďte analýzu původní příčiny u neúspěšné odpovědi.
Pro rychlejší vývojovou smyčku můžete aktualizovat kód agenta přímo a iterovat vyvoláním agenta proti příkladu neúspěšného vstupu.
Řešení chyb ověřování
Pokud nasazený agent při přístupu k prostředkům, jako jsou indexy vektorového vyhledávání nebo koncové body LLM, dochází k chybám ověřování, zkontrolujte, jestli se protokoloval s potřebnými prostředky pro předávání automatického ověřování. Vizte automatické ověřování průchodem.
Pokud chcete zkontrolovat protokolované prostředky, spusťte v poznámkovém bloku následující příkaz:
%pip install -U mlflow[databricks]
%restart_python
import mlflow
mlflow.set_registry_uri("databricks-uc")
# Replace with the model name and version of your deployed agent
agent_registered_model_name = ...
agent_model_version = ...
model_uri = f"models:/{agent_registered_model_name}/{agent_model_version}"
agent_info = mlflow.models.Model.load(model_uri)
print(f"Resources logged for agent model {model_uri}:", agent_info.resources)
Pokud chcete znovu přidat chybějící nebo nesprávné zdroje, musíte agenta přihlásit a znovu ho nasadit.
Pokud pro prostředky používáte ruční ověřování, zkontrolujte, že jsou správně nastavené proměnné daného prostředí. Ruční nastavení přebijí všechny konfigurace automatického ověřování. Viz ruční ověřování.