部署適用於產生 AI 應用程式的代理程式

使用deploy() 中的函數，在 Mosaic AI Model Serving 上部署您的 AI 代理程式。部署會建立具有內建延展性、監視和協作工具的服務端點。

您部署的代理程式會自動與 MLflow 3 評估和監視功能整合，包括即時追蹤、專案關係人意見反應的檢閱應用程式，以及監視。

Requirements

MLflow 3

在 Unity 目錄中註冊您的代理程式。
安裝 MLflow 3.1.3 或更新版本，以使用 API deploy()部署databricks.agents代理程式。
從 Databricks 筆記本外部部署代理程式需要 databricks-agents SDK 1.1.0 版或更新版本。

安裝前置需求：

# Install prerequisites
%pip install mlflow>=3.1.3 databricks-agents>=1.1.0

# Restart Python to make sure the new packages are picked up
dbutils.library.restartPython()

MLflow 2.x

Important

Databricks 建議使用 MLflow 3 來部署代理程式，因為某些 MLflow 2 記錄功能將會被取代。請參閱詳細的部署動作。

在 Unity 目錄中註冊您的代理程式。
安裝 MLflow 2.13.1 或更新版本，以使用 API deploy()部署databricks.agents代理程式。
從 Databricks Notebook 外部部署代理程式需要 databricks-agents SDK 0.12.0 版或更新版本。

安裝前置需求：

# Install prerequisites
%pip install mlflow>=2.13.1 databricks-agents>=0.12.0

# Restart Python to make sure the new packages are picked up
dbutils.library.restartPython()

部署代理程式使用 `deploy()`

將代理程式部署至模型服務端點：

from databricks import agents

deployment = agents.deploy(uc_model_name, uc_model_info.version)

# Retrieve the query endpoint URL for making API requests
deployment.query_endpoint

當您呼叫 deploy（）時，Databricks 會自動設定生產基礎結構，並藉由執行下列動作，將您的代理程式與 MLflow 生成 AI 功能整合：

警告

如果您要從儲存在 Databricks Git 資料夾中的筆記本部署代理程式，MLflow 3 即時追蹤預設不會運作。

若要啟用即時追蹤，請在執行mlflow.set_experiment()之前將agents.deploy()實驗設定為非 Git 相關聯的實驗。

函 deploy() 式預設會執行下列動作：

建立模型服務端點 ，以透過自動擴展和負載平衡來託管代理程式
為您的代理程式提供安全驗證以存取基礎資源
通過 MLflow 實驗追蹤和生產流量的自動化質量評估實現實時監控
使用審查應用程序設置利益相關者協作以收集反饋

如需詳細資訊，請參閱詳細部署動作。

自訂部署

傳送其他引數給 deploy()，來自訂部署。例如，您可以透過傳遞 scale_to_zero_enabled=True，為閒置端點啟用零化調整功能。這可降低成本，但會增加提供初始查詢的時間。

如需更多參數，請參閱 Databricks Agents Python API。

檢索和刪除代理部署

擷取或管理現有的代理程式部署。請參閱 Databricks Agents Python API。

from databricks.agents import list_deployments, get_deployments, delete_deployment

# Print all current deployments
deployments = list_deployments()
print(deployments)

# Get the deployment for a specific agent model name and version
agent_model_name = ""    # Set to your Unity Catalog model name
agent_model_version = 1  # Set to your agent model version
deployment = get_deployments(model_name=agent_model_name, model_version=agent_model_version)

# List all deployments
all_deployments = list_deployments()

# Delete an agent deployment
delete_deployment(model_name=agent_model_name, model_version=agent_model_version)

相依資源的驗證

代理程式在部署時，通常需要向其他資源進行驗證，才能完成工作。例如，代理程式可能需要存取向量搜尋索引來查詢非結構化數據。

如需驗證方法的相關資訊，包括何時使用這些方法以及如何設定它們，請參閱 AI 代理程式的驗證。

詳細部署動作

下表列出由 deploy() 呼叫所產生的詳細部署動作。部署最多需要 15 分鐘的時間才能完成。

MLflow 3

`deploy()` 行動	Description
建立模型服務端點	建立可擴展的 REST API 端點，透過自動負載平衡，將您的代理程式提供給面向使用者的應用程式。
佈建安全驗證	自動提供短期認證，讓您的代理程式以最低必要許可權存取 Databricks 管理的資源（向量搜尋索引、Unity 目錄函式等）。 Databricks 會在發出認證之前驗證端點擁有者具有適當的許可權，以防止未經授權的存取。針對非 Databricks 資源，請將具有秘密的環境變數傳遞至 `deploy()`。請參閱設定模型服務端點對資源的存取權。
啟用檢閱應用程式	提供 Web 介面，利害關係人可以在其中與您的客服專員互動並提供回饋。請參閱透過標記現有追蹤來收集反饋與期望。
啟用即時追蹤	將所有代理程式互動即時記錄到 MLflow 實驗，提供監控和偵錯的即時可見性。從端點寫入至目前作用中的 MLflow 實驗的追溯（以 `mlflow.set_experiment()` 設定）端點中的所有代理程式都會共用相同的追蹤儲存實驗追蹤也會寫入推論資料表，以進行長期儲存
啟用生產監控（Beta 版）	設定自動化品質評估，以在生產流量上執行評分器。請參閱生產監控。
啟用推斷數據表	建立資料表，記錄要求輸入和回應以進行稽核和分析。儆：要求記錄和評估記錄已淘汰，並將在未來版本中移除。請改用 MLflow 3 即時追蹤。請參閱要求記錄和評估記錄棄用，以取得移轉指引。所有代理程式都使用 AI 閘道推論資料表進行記錄串流回應只會記錄與`ResponsesAgent`、`ChatAgent`和`ChatCompletion`模式相容的欄位。
記錄 REST API 要求並檢閱應用程式意見反應	將 API 要求和意見反應記錄至推斷數據表。儆：意見反應模型已被取代，並將在未來版本中移除。升級至 MLflow 3 並改用 `log_feedback` API。請參閱收集使用者意見反應。建立意見反應模型以接受並記錄來自檢閱應用程式的意見反應。此模型被部署於與您的代理程式相同的 CPU 型號服務端點。

MLflow 2

`deploy()` 行動	Description
建立模型服務端點	建立可擴展的 REST API 端點，透過自動負載平衡，將您的代理程式提供給面向使用者的應用程式。
佈建安全驗證	自動提供短期認證，讓您的代理程式以最低必要許可權存取 Databricks 管理的資源（向量搜尋索引、Unity 目錄函式等）。 Databricks 會在發出認證之前驗證端點擁有者具有適當的許可權，以防止未經授權的存取。針對非 Databricks 資源，請將具有秘密的環境變數傳遞至 `deploy()`。請參閱設定模型服務端點對資源的存取權。
啟用檢閱應用程式	提供 Web 介面，利害關係人可以在其中與您的客服專員互動並提供回饋。請參閱透過標記現有追蹤來收集反饋與期望。
啟用推斷數據表	建立資料表，記錄要求輸入和回應以進行稽核和分析。儆：要求記錄和評估記錄已淘汰，並將在未來版本中移除。請參閱要求記錄和評估記錄棄用，以取得移轉指引。所有代理程式都使用 AI 閘道推論資料表進行記錄已淘汰的代理程式結構描述（隨`databricks-agents<1.4.0`一起部署）使用標準推論資料表串流回應只會記錄與`ResponsesAgent`、`ChatAgent`和`ChatCompletion`結構描述相容的欄位。
記錄 REST API 要求和檢閱應用程式意見反應（已淘汰）	將 API 要求和意見反應記錄至推斷數據表。儆：意見反應模型已被取代，並將在未來版本中移除。升級至 MLflow 3 並改用 `log_feedback` API。請參閱收集使用者意見反應。建立意見反應模型以接受並記錄來自檢閱應用程式的意見反應。此模型被部署於與您的代理程式相同的 CPU 型號服務端點。

後續步驟

意見反應

此頁面對您有幫助嗎？

Last updated on 2025-11-07

共用方式為

部署適用於產生 AI 應用程式的代理程式

Requirements

MLflow 3

MLflow 2.x

部署代理程式使用 deploy()

自訂部署

檢索和刪除代理部署

相依資源的驗證

詳細部署動作

MLflow 3

MLflow 2

後續步驟

意見反應

其他資源

部署代理程式使用 `deploy()`