適用於:所有 API 管理層級
您可以將部署在 Azure AI Foundry 中的 AI 模型端點匯入 API 管理實例作為 API。 使用 API 管理中的 AI 閘道原則和其他功能來簡化整合、改善可檢視性,以及增強對模型端點的控制。
深入瞭解在 API 管理中管理 AI API:
用戶端相容性選項
API 管理支援兩個適用於 AI API 的用戶端相容性選項。 選擇適合模型部署的選項。 選項會決定用戶端如何呼叫 API,以及 API 管理實例如何將要求路由傳送至 AI 服務。
Azure AI - 管理透過 Azure AI 模型推斷 API 公開的 Azure AI Foundry 中的模型端點。
客戶端會在
/models
等端點呼叫部署,例如/my-model/models/chat/completions
。 部署名稱會在要求本文中傳遞。 如果您想要彈性地在透過 Azure AI 模型推斷 API 公開的模型與部署在 Azure OpenAI 服務中的模型之間切換,請使用此選項。Azure OpenAI 服務 - 管理部署在 Azure OpenAI 服務中的模型端點。
客戶會在
/openai
端點呼叫部署,例如/openai/deployments/my-deployment/chat/completions
。 部署名稱會在要求路徑中傳遞。 如果您的 AI 服務只包含 Azure OpenAI 服務模型部署,請使用此選項。
先決條件
- 現有的 API 管理執行個體。 若您還沒有執行個體,請加以建立。
- 訂用帳戶中已部署一或多個模型的 Azure AI 服務。 範例包括部署在 Azure AI Foundry 或 Azure OpenAI Service 中的模型。
使用入口網站匯入 AI Foundry API
使用下列步驟將 AI API 匯入至 API 管理。
當您匯入 API 時,APIM 會自動設定:
- 各個 REST API 端點的作業
- 系統指派的身分識別,具有存取 AI 服務部署的必要許可權。
- 將 API 要求導向至 AI 服務端點的 後端 資源和 set-backend-service 原則。
- 使用實例系統指派的受控識別向後端驗證。
- (選擇性)可協助您監視和管理 API 的原則。
若要將 AI Foundry API 匯入至 API 管理:
在 Azure 入口網站中,流覽至您的 API 管理實例。
在左側功能表 的 [API] 底下,選取 [API]>[+ 新增 API]。
在 [ 從 Azure 資源建立] 下,選取 [Azure AI Foundry]。
在選取 AI 服務標籤上:
- 選取在其中搜尋 AI 服務的 訂閱帳戶。 若要取得服務中模型部署的相關信息,請選取服務名稱旁的 部署 連結。
- 選取 AI 服務。
- 選取 下一步。
- 選取在其中搜尋 AI 服務的 訂閱帳戶。 若要取得服務中模型部署的相關信息,請選取服務名稱旁的 部署 連結。
在 [設定 API] 標籤頁上:
輸入 API 的 [顯示名稱] 和選擇性 [描述]。
在 [基底路徑] 中,輸入 API 管理實例用來存取部署端點的路徑。
選擇性地選取一或多個 要 與 API 建立關聯的產品。
在 [用戶端相容性] 中,根據您想要支援的用戶端類型,選取下列任一項。 如需詳細資訊 ,請參閱用戶端相容性選項 。
- Azure OpenAI - 如果您的用戶端只需要存取 Azure OpenAI 服務模型部署,請選取此選項。
- Azure AI - 如果您的用戶端需要存取 Azure AI Foundry 中的其他模型,請選取此選項。
選取 下一步。
在 [ 管理令牌取用 ] 索引標籤上,選擇性地輸入設定或接受定義下列原則的預設值,以協助監視和管理 API:
在 [ 套用語意快取 ] 索引標籤上,選擇性地輸入設定或接受定義原則的預設值,以協助優化效能並減少 API 的延遲:
在 AI 內容安全性上,選擇性地輸入設定或接受預設值來設定 Azure AI 內容安全服務,以封鎖含有不安全內容的提示:
選取 檢閱。
驗證設定之後,請選取 [建立]。
測試 AI API
若要確保您的 AI API 如預期般運作,請在 API Management 測試控制台中進行測試。
選取您在上一個步驟中建立的 API。
選取 [測試] 索引標籤。
選取與模型部署相容的作業。 頁面會顯示參數和標頭的欄位。
視需要輸入參數和標頭。 視作業而定,您可能需要設定或更新 要求本文。
備註
在測試主控台中,API 管理會自動填入 Ocp-Apim-Subscription-Key 標頭,並設定內建所有存取訂用帳戶的訂用帳戶金鑰。 此金鑰可讓您存取 API 管理執行個體中的每個 API。 (選擇性) 選取 [HTTP 要求] 旁的「眼睛」圖示以顯示 Ocp-Apim-Subscription-Key 標頭。
選擇 傳送。
測試成功時,後端會以成功的 HTTP 回應碼和某些資料進行回應。 附加至回應是令牌使用方式數據,可協助您監視和管理語言模型令牌耗用量。