Wdrażanie agenta na potrzeby generowania aplikacji sztucznej inteligencji (obsługa modeli)

Important

W przypadku nowych przypadków użycia usługa Databricks zaleca wdrażanie agentów w usłudze Databricks Apps w celu uzyskania pełnej kontroli nad kodem agenta, konfiguracją serwera i przepływem pracy wdrażania. Zobacz Tworzenie agenta sztucznej inteligencji i wdrażanie go w usłudze Databricks Apps. Aby przeprowadzić migrację istniejącego agenta, zobacz Migrowanie agenta z usługi Model Serving do usługi Databricks Apps.

Wdróż agenta sztucznej inteligencji w ramach Mosaic AI Model Serving przy użyciu funkcji deploy() z Agent Framework Python API. Wdrożenie tworzy punkt końcowy obsługujący z wbudowanymi narzędziami do skalowania, monitorowania i współpracy.

Wdrożony agent automatycznie integruje się z możliwościami oceny i monitoringu platformy MLflow 3, w tym śledzeniem w czasie rzeczywistym, aplikacją do przeglądu dla opinii interesariuszy i monitorowaniem.

Requirements

MLflow 3

Zarejestruj agenta w Unity Catalog.
Zainstaluj platformę MLflow 3.1.3 lub nowszą, aby wdrożyć agentów przy użyciu interfejsu deploy() API z programu databricks.agents.
Wdrażanie agentów spoza notesu usługi Databricks wymaga databricks-agents zestawu SDK w wersji 1.1.0 lub nowszej.

Zainstaluj wymagania wstępne:

# Install prerequisites
%pip install mlflow>=3.1.3 databricks-agents>=1.1.0

# Restart Python to make sure the new packages are picked up
dbutils.library.restartPython()

MLflow 2.x

Important

Firma Databricks rekomenduje używanie platformy MLflow 3 do wdrażania agentów, ponieważ niektóre funkcje rejestrowania MLflow 2 zostaną wycofane. Zobacz szczegółowe akcje wdrażania.

Zarejestruj agenta w Unity Catalog.
Zainstaluj MLflow w wersji 2.13.1 lub nowszej, aby wdrożyć agentów przy użyciu interfejsu API deploy() z databricks.agents.
Wdrażanie agentów spoza zeszytu Databricks wymaga użycia pakietu SDK w wersji 0.12.0 lub wyższej.

Zainstaluj wymagania wstępne:

# Install prerequisites
%pip install mlflow>=2.13.1 databricks-agents>=0.12.0

# Restart Python to make sure the new packages are picked up
dbutils.library.restartPython()

Wdrażanie agentów przy użyciu polecenia `deploy()`

Wdróż agenta w punkcie końcowym obsługującym model:

from databricks import agents

deployment = agents.deploy(uc_model_name, uc_model_info.version)

# Retrieve the query endpoint URL for making API requests
deployment.query_endpoint

Po wywołaniu metody deploy()usługa Databricks automatycznie konfiguruje infrastrukturę produkcyjną i integruje agenta z funkcjami sztucznej inteligencji usługi MLflow gen, wykonując następujące czynności:

Ostrzeżenie

Jeśli wdrażasz agenta z notesu przechowywanego w folderze Git usługi Databricks, śledzenie MLflow 3 w czasie rzeczywistym nie będzie działać domyślnie.

Aby włączyć śledzenie w czasie rzeczywistym, ustaw eksperyment jako niezwiązany z usługą Git, używając mlflow.set_experiment(), przed uruchomieniem agents.deploy().

Funkcja deploy() domyślnie wykonuje następujące akcje:

Tworzy model obsługujący punkt końcowy do hostowania agenta przy użyciu automatycznego skalowania i równoważenia obciążenia
Zapewnia bezpieczne uwierzytelnianie dla agenta w celu uzyskania dostępu do zasobów podstawowych
Umożliwia monitorowanie w czasie rzeczywistym za pomocą śledzenia eksperymentów MLflow i zautomatyzowanej oceny jakości ruchu produkcyjnego
Ustawia współpracę interesariuszy przy użyciu aplikacji Review do zbierania opinii.

Aby uzyskać więcej informacji, zobacz Szczegółowe akcje wdrażania.

Dostosowywanie wdrożenia

Aby dostosować wdrożenie, przekaż dodatkowe argumenty do deploy(). Na przykład możesz włączyć skalowanie do zera dla bezczynnych punktów końcowych, przekazując scale_to_zero_enabled=True. Zmniejsza to koszty, ale zwiększa czas obsługi zapytań początkowych.

Aby uzyskać więcej parametrów, zobacz Databricks Agents Python API.

Pobieranie i usuwanie wdrożeń agentów

Uzyskaj dostęp do istniejących wdrożeń agentów lub zarządzaj nimi. Zobacz Databricks Agents Python API.

from databricks.agents import list_deployments, get_deployments, delete_deployment

# Print all current deployments
deployments = list_deployments()
print(deployments)

# Get the deployment for a specific agent model name and version
agent_model_name = ""    # Set to your Unity Catalog model name
agent_model_version = 1  # Set to your agent model version
deployment = get_deployments(model_name=agent_model_name, model_version=agent_model_version)

# List all deployments
all_deployments = list_deployments()

# Delete an agent deployment
delete_deployment(model_name=agent_model_name, model_version=agent_model_version)

Uwierzytelnianie dla zasobów zależnych

Agenci często muszą uwierzytelniać się w innych zasobach, aby wykonywać zadania po ich wdrożeniu. Na przykład agent może potrzebować dostępu do indeksu wyszukiwania wektorowego w celu wykonywania zapytań dotyczących danych bez struktury.

Aby uzyskać informacje o metodach uwierzytelniania, w tym o tym, kiedy ich używać i jak je skonfigurować, zobacz Authentication for AI agents (Model Serving) (Uwierzytelnianie agentów sztucznej inteligencji (obsługa modelu).

Sieć dla wdrożeń agentów

Jeśli obszar roboczy używa łącza prywatnego lub ograniczonych zasad sieciowych egress, należy skonfigurować dostęp sieciowy, aby wdrożenia agentów były pomyślne. Model obsługujący punkty końcowe wymaga dostępu wychodzącego do pobierania zależności podczas procesu kompilacji kontenera. Agenci mogą również potrzebować dostępu do zewnętrznych interfejsów API podczas działania.

Aby uzyskać informacje na temat agentów wdrożonych w usłudze Databricks Apps, zobacz Deploy apps in Private Link environments (Szczegółowe wskazówki dotyczące konfigurowania zasad dns lub wychodzących).

W przypadku agentów wdrożonych w usłudze Model Serving sprawdź następujące kwestie:

Zależności czasu budowania: Zasady sieciowe muszą zezwalać na dostęp do repozytoriów pakietów wymaganych przez środowisko agenta, takie jak pypi.org lub files.pythonhosted.org dla pakietów Python. Azure Databricks rejestruje błędy kompilacji spowodowane zablokowanym dostępem sieciowym z network_source_type: ML Build do tabeli systemowej system.access.outbound_network. Zobacz Weryfikowanie przy użyciu obsługi modelu.
Zależności środowiska uruchomieniowego: Jeśli agent wywołuje zewnętrzne interfejsy API lub usługi podczas wnioskowania, dodaj te domeny do listy dozwolonych zasad sieciowych.
DNS resolution: W środowiskach Private Link sprawdź, czy agent może rozpoznać nazwy hostów dowolnych usług Azure Databricks, od których zależy, na przykład punktów końcowych usługi Vector Search lub SQL Warehouse.

Szczegółowe akcje wdrażania

W poniższej tabeli wymieniono szczegółowe działania wdrożeniowe, które są wynikiem wywołania deploy(). Ukończenie wdrożeń może potrwać do 15 minut.

MLflow 3

`deploy()` akcja	Description
Tworzenie punktu końcowego obsługującego model	Tworzy skalowalny punkt końcowy interfejsu API REST, który służy agentowi do aplikacji przeznaczonych dla użytkowników z automatycznym równoważeniem obciążenia.
Aprowizuj bezpieczne uwierzytelnianie	Automatycznie udostępnia krótkotrwałe poświadczenia, które umożliwiają agentowi dostęp do zasobów zarządzanych przez Databricks (indeksy wyszukiwania wektorowego, funkcje Katalogu Unity itp.) z minimalnymi wymaganymi uprawnieniami. Usługa Databricks sprawdza, czy właściciel punktu końcowego ma odpowiednie uprawnienia przed wystawieniem poświadczeń, uniemożliwiając nieautoryzowany dostęp. W przypadku zasobów innych niż Databricks przekaż zmienne środowiskowe z sekretami do `deploy()`. Zobacz Konfigurowanie dostępu do zasobów z poziomu punktów końcowych obsługujących model.
Włącz aplikację przeglądową	Udostępnia interfejs internetowy, w którym osoby biorące udział w projekcie mogą wchodzić w interakcje z agentem i przekazywać opinie. Zobacz Zbieranie opinii i oczekiwań przez etykietowanie istniejących śladów.
Włączanie śledzenia w czasie rzeczywistym	Rejestruje wszystkie interakcje agenta z eksperymentem MLflow w czasie rzeczywistym, zapewniając bezpośredni wgląd w monitorowanie i debugowanie. Ślady z punktu końcowego są zapisywane do aktualnie aktywnego eksperymentu MLflow (ustawionego za pomocą `mlflow.set_experiment()` polecenia) Wszyscy agenci w punkcie końcowym dzielą ten sam eksperyment dla przechowywania śladów Ślady są również zapisywane w tabelach wnioskowania dla długoterminowego przechowywania.
Włączanie monitorowania produkcyjnego (wersja beta)	Konfiguruje automatyczną ocenę jakości, która uruchamia oceny ruchu produkcyjnego. Zobacz Monitorowanie produkcji.
Włączanie tabel wnioskowania	Tworzy tabele, które rejestrują dane wejściowe żądań i odpowiedzi na potrzeby inspekcji i analizy. Ostrzeżenie: Dzienniki żądań i dzienniki oceny są przestarzałe i zostaną usunięte w przyszłej wersji. Zamiast tego należy użyć funkcji śledzenia MLflow 3 w czasie rzeczywistym. Aby uzyskać wskazówki dotyczące migracji, zobacz wycofywanie dzienników żądań i dzienników oceny . Wszyscy agenci używają tablic inferencyjnych bramy AI do rejestrowania Odpowiedzi przesyłane strumieniowo logują tylko te pola, które są zgodne ze schematami `ResponsesAgent`, `ChatAgent`, i `ChatCompletion`.
Rejestrowanie żądań interfejsu API REST i przeglądanie opinii o aplikacji	Rejestruje żądania interfejsu API i opinie do tabeli wnioskowania. Ostrzeżenie:Model opinii jest przestarzały i zostanie usunięty w przyszłej wersji. Uaktualnij do MLflow 3 i zamiast tego użyj `log_feedback` API. Zobacz Zbieranie opinii użytkowników. Tworzenie modelu opinii w celu akceptowania i rejestrowania opinii z aplikacji przeglądu. Ten model jest obsługiwany w tym samym modelu procesora na tym samym punkcie końcowym co wdrożony agent.

MLflow 2

`deploy()` akcja	Description
Tworzenie punktu końcowego obsługującego model	Tworzy skalowalny punkt końcowy interfejsu API REST, który służy agentowi do aplikacji przeznaczonych dla użytkowników z automatycznym równoważeniem obciążenia.
Aprowizuj bezpieczne uwierzytelnianie	Automatycznie udostępnia krótkotrwałe poświadczenia, które umożliwiają agentowi dostęp do zasobów zarządzanych przez Databricks (indeksy wyszukiwania wektorowego, funkcje Katalogu Unity itp.) z minimalnymi wymaganymi uprawnieniami. Usługa Databricks sprawdza, czy właściciel punktu końcowego ma odpowiednie uprawnienia przed wystawieniem poświadczeń, uniemożliwiając nieautoryzowany dostęp. W przypadku zasobów innych niż Databricks przekaż zmienne środowiskowe z sekretami do `deploy()`. Zobacz Konfigurowanie dostępu do zasobów z poziomu punktów końcowych obsługujących model.
Włącz aplikację przeglądową	Udostępnia interfejs internetowy, w którym osoby biorące udział w projekcie mogą wchodzić w interakcje z agentem i przekazywać opinie. Zobacz Zbieranie opinii i oczekiwań przez etykietowanie istniejących śladów.
Włączanie tabel wnioskowania	Tworzy tabele, które rejestrują dane wejściowe żądań i odpowiedzi na potrzeby inspekcji i analizy. Ostrzeżenie: Dzienniki żądań i dzienniki oceny są przestarzałe i zostaną usunięte w przyszłej wersji. Aby uzyskać wskazówki dotyczące migracji, zobacz wycofywanie dzienników żądań i dzienników oceny . Wszyscy agenci używają tablic inferencyjnych bramy AI do rejestrowania Przestarzałe schematy agentów (wdrożone za pomocą `databricks-agents<1.4.0`) używają standardowych tabel wnioskowania Strumieniowe odpowiedzi rejestrują tylko pola zgodne ze schematami `ResponsesAgent`, `ChatAgent` i `ChatCompletion`.
Rejestrowanie żądań interfejsu API REST i przeglądanie opinii o aplikacji (przestarzałe)	Rejestruje żądania interfejsu API i opinie do tabeli wnioskowania. Ostrzeżenie:Model opinii jest przestarzały i zostanie usunięty w przyszłej wersji. Uaktualnij do MLflow 3 i zamiast tego użyj `log_feedback` API. Zobacz Zbieranie opinii użytkowników. Tworzenie modelu opinii w celu akceptowania i rejestrowania opinii z aplikacji przeglądu. Ten model jest obsługiwany w tym samym modelu procesora na tym samym punkcie końcowym co wdrożony agent.

Dalsze kroki

Opinia

Czy ta strona była pomocna?

Last updated on 2026-04-19

Wdrażanie agenta na potrzeby generowania aplikacji sztucznej inteligencji (obsługa modeli)

Requirements

MLflow 3

MLflow 2.x

Wdrażanie agentów przy użyciu polecenia deploy()

Dostosowywanie wdrożenia

Pobieranie i usuwanie wdrożeń agentów

Uwierzytelnianie dla zasobów zależnych

Sieć dla wdrożeń agentów

Szczegółowe akcje wdrażania

MLflow 3

MLflow 2

Dalsze kroki

Opinia

Dodatkowe zasoby

Wdrażanie agentów przy użyciu polecenia `deploy()`