備註
本文件指的是 Microsoft Foundry(經典版)入口網站。
Agents(經典版)現已棄用,將於 2027 年 3 月 31 日退役。 請使用普遍可用的 Microsoft Foundry Agents Service 中的新代理。 請依照 遷移指南 更新你的工作負載。
Azure OpenAI 模型啟用 Microsoft Foundry 代理服務中的代理。 本文將協助你選擇支援的型號與區域組合以供部署使用。 選擇合適的型號與地區會影響您的客服人員的能力、延遲與成本。
要使用這些模型,你需要一個 Microsoft Foundry 專案並能使用 Foundry Agent Service。
Microsoft Foundry 提供兩種主要的部署類型:
- Standard 包含全球部署選項,可將流量路由至 Azure 的全球基礎設施,以最大化吞吐量與可用性。
- 配置 中還包含全球部署選項。 你可以在 Azure 全球基礎設施中購買並部署配置處理吞吐量單元(PTU),以達到可預測的效能。
所有部署都能執行相同的推理操作。 然而,計費、規模和績效有很大差異。 欲了解更多Azure OpenAI 部署類型,請參閱 Deployment types for Microsoft Foundry Models。
如何使用此頁面
請使用本文中的表格,選擇支援的部署類型、模型版本及 Azure 區域組合。
- 部署類型:使用分頁選擇你打算使用的部署類型(標準或配置型)。
- Region:Region欄位列出你部署模型的Azure區域。
-
可用性指標:
- ✅:支持。
- 空白格或
-:不支援。
選擇一個模型
根據經紀人的需求選擇車型:
- GPT-5 家族 (GPT-5、GPT-5-MINI、GPT-5-Nano、GPT-5-Chat):針對複雜多步驟任務進行前沿規模推理。 進入需先行登記。
- GPT-4.1 家族 (GPT-4.1、GPT-4.1-mini、GPT-4.1-nano):用於通用代理工作負載的成本效益模型。
- GPT-4O系列 (GPT-4O、GPT-4O-MINI):具備視覺支援的多模態能力。
- GPT-4 與 GPT-35-turbo:舊有型號,向下相容。
小提示
快速開始:大多數新代理商可於 2024-11-20 在 swedencentral 或 eastus2 部署 gpt-4o,採用全球標準部署。 這些區域在大多數情況下擁有廣泛的模型可用性與低延遲。
可用的模型
Foundry Agent Service 支援以下 Azure OpenAI 模型,涵蓋上述區域。
請記住,模型的可用性會因地區和雲端而異。 某些工具和功能需要最新的模型。 REST API 和 SDK 中提供下列模型。
備註
| 區域 | gpt-5 | gpt-5-mini | GPT-5-Nano | gpt-5-chat | GPT-4.1 | GPT-4.1-奈米 | GPT-4.1-mini | gpt-4o(05-13) | GPT-4O(08-06) | gpt-4o(11-20) | gpt-4o-mini | gpt-4 | gpt-4-turbo |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 澳大利亞東部 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ||
| brazilsouth(巴西南部) | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | |||||
| canadaeast | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ||||
| eastus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | |||
| eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| francecentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ||||
| 德國西中部 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ||||
| italynorth | ✅ | ✅ | ✅ | ✅ | ✅ | ||||||||
| japaneast | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ||
| 挪威東部 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ||||
| southafricanorth | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | |||||
| southcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ||||
| 南印度 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ||
| swedencentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| switzerlandnorth | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ||
| uksouth | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ||
| 西歐 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | |||||
| 維斯特斯 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ||||
| westus3 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
非 OpenAI 模型
除了 Azure OpenAI 模型外,你也可以使用由 Azure 直接販售的模型。 這些模型提供特定使用情境的專業能力,例如確定性推理或高吞吐量產生。
直接由 Azure 銷售的型號:
- MAI-DS-R1:確定性、精確度導向的推理。
- GROK-4:用於複雜多步驟問題解決的前沿尺度推理。
- grok-4-fast-reasoning:針對工作流程自動化最佳化的加速代理式推理。
- grok-4-fast-non-reasoning:高輸送量、低延遲的生成與系統路由。
- GROK-3:針對複雜系統層級的工作流程提供強而有力的推理。
- Grok-3-mini:輕量化模型,優化於互動式、大量使用情境。
- Llama-3.3-70B-Instruct:企業問答、決策支援及系統協調的多功能模型。
- Llama-4-Maverick-17B-128E-Instruct-FP8:FP8 優化模型,提供快速且具成本效益的推理。
- DeepSeek-V3-0324:跨文本與影像的多模態理解。
- DeepSeek-V3.1:強化多模態推理與接地檢索。
- DeepSeek-R1-0528:進階長式與多步驟推理。
- GPT-OSS-120b:支持透明度與可重現性的開放生態系統模型。
在 Foundry 入口網站查看所有代理支援模型
欲在 Foundry 入口網站查看完整支援型號清單:
- 登入 Microsoft Foundry。 確定新鑄造廠的開關是關閉的。 這些步驟指的是Foundry (classic)。
- 請前往 模型目錄。
- 依 能力 篩選模型並選擇 支援代理。
驗證模型支援
模型的可用性會隨時間改變。
- 要驗證你能部署到專案和區域的方案,請使用前一節所述的 Foundry 入口網站模型經驗。
- 如果你使用配置過的吞吐量,務必確保目標區域內有可用的配置處理吞吐量單元(PTU)。 背景請參見 「配置吞吐量」。
故障排除
你所在地區沒有某個型號或版本
- 確認你選對了部署類型的標籤。
- 試試看支援該型號和版本的其他區域。
- 如果你用的是 GPT-5 模型,請確保你的訂閱有權限。 部分車型需註冊。
檔案搜尋功能無法提供
- 義大利北部和巴西南部無法提供檔案搜尋功能。 選擇支援的區域,或使用其他工具。