Ladění nasazeného agenta AI

2025-04-30

Na této stránce se dozvíte, jak ladit běžné problémy při nasazování agentů AI pomocí API Agent Frameworku Mosaic AI agents.deploy().

Agent Framework se nasadí do koncových bodů obsluhy modelů, takže byste měli kromě kroků ladění agenta na této stránce zkontrolovat průvodce laděním pro obsluhu modelu .

Navrhování agentů s využitím osvědčených postupů

Při vytváření agentů použijte následující osvědčené postupy:

Vylepšete ladění pomocí doporučených rozhraní pro vývoj agentů a trasování MLflow: Dodržujte nejlepší postupy v autorizaci AI agentů v kódu, jako je povolení automatického logování trasování MLflow, aby bylo ladění agentů snadnější.
Jasně zdokumentujte nástroje: Jasné popisy nástrojů a parametrů zajistí, že váš agent rozumí vašim nástrojům a správně je používá. Podívejte se na vylepšení volání nástrojů pomocí jasné dokumentace.
Přidání časových limitů a limitů tokenů pro volání LLM: Přidejte do kódu časové limity a limity tokenů, abyste zabránili zpožděním způsobeným dlouhotrvajícími kroky.
- Pokud váš agent používá klienta OpenAI k dotazování na koncový bod služby Databricks LLM, nastavte vlastní časové limity při volání na koncové body podle potřeby.

Ladění pomalých nebo neúspěšných požadavků na nasazené agenty

Pokud jste při vytváření agenta povolili automatické protokolování trasování MLflow , trasování se automaticky zaprotokoluje v tabulkách odvozování. Tyto stopy mohou pomoci identifikovat komponenty agenta, které jsou pomalé nebo selhávají.

Identifikace problematických požadavků

Při hledání problematických požadavků postupujte takto:

V pracovním prostoru přejděte na kartu Obsluha a vyberte název nasazení.
V části Odvozovací tabulky vyhledejte plně kvalifikovaný název tabulky odvození. Například: my-catalog.my-schema.my-table.
V poznámkovém bloku Databricks spusťte následující příkaz:
```
%sql
SELECT * FROM my-catalog.my-schema.my-table
```
Podrobné informace o trasování najdete ve sloupci Odpověď .
Filtrovat podle request_time, databricks_request_id nebo status_code a zúžit výsledky.
```
%sql
SELECT * FROM my-catalog.my-schema.my-table
WHERE status_code != 200
```

Analýza problémů s původní příčinou

Po identifikaci neúspěšných nebo pomalých požadavků použijte rozhraní API mlflow.models.validate_serving_input k vyvolání agenta proti neúspěšné vstupní žádosti. Pak si prohlédněte výsledné trasování a proveďte analýzu původní příčiny u neúspěšné odpovědi.

Pro rychlejší vývojovou smyčku můžete aktualizovat kód agenta přímo a iterovat vyvoláním agenta proti příkladu neúspěšného vstupu.

Řešení chyb ověřování

Pokud nasazený agent při přístupu k prostředkům, jako jsou indexy vektorového vyhledávání nebo koncové body LLM, dochází k chybám ověřování, zkontrolujte, jestli se protokoloval s potřebnými prostředky pro předávání automatického ověřování. Vizte automatické ověřování průchodem.

Pokud chcete zkontrolovat protokolované prostředky, spusťte v poznámkovém bloku následující příkaz:

%pip install -U mlflow[databricks]
%restart_python

import mlflow
mlflow.set_registry_uri("databricks-uc")

# Replace with the model name and version of your deployed agent
agent_registered_model_name = ...
agent_model_version = ...

model_uri = f"models:/{agent_registered_model_name}/{agent_model_version}"
agent_info = mlflow.models.Model.load(model_uri)
print(f"Resources logged for agent model {model_uri}:", agent_info.resources)

Pokud chcete znovu přidat chybějící nebo nesprávné zdroje, musíte agenta přihlásit a znovu ho nasadit.

Pokud pro prostředky používáte ruční ověřování, zkontrolujte, že jsou správně nastavené proměnné daného prostředí. Ruční nastavení přebijí všechny konfigurace automatického ověřování. Viz ruční ověřování.

Sdílet prostřednictvím