共用方式為


Azure OpenAI 模型和區域,用於 Foundry Agent 服務(經典版)

備註

本文件指的是 Microsoft Foundry(經典版)入口網站。

Agents(經典版)現已棄用,將於 2027 年 3 月 31 日退役。 請使用普遍可用的 Microsoft Foundry Agents Service 中的新代理。 請依照 遷移指南 更新你的工作負載。

Azure OpenAI 模型啟用 Microsoft Foundry 代理服務中的代理。 本文將協助你選擇支援的型號與區域組合以供部署使用。 選擇合適的型號與地區會影響您的客服人員的能力、延遲與成本。

要使用這些模型,你需要一個 Microsoft Foundry 專案並能使用 Foundry Agent Service。

Microsoft Foundry 提供兩種主要的部署類型:

  • Standard 包含全球部署選項,可將流量路由至 Azure 的全球基礎設施,以最大化吞吐量與可用性。
  • 配置 中還包含全球部署選項。 你可以在 Azure 全球基礎設施中購買並部署配置處理吞吐量單元(PTU),以達到可預測的效能。

所有部署都能執行相同的推理操作。 然而,計費、規模和績效有很大差異。 欲了解更多Azure OpenAI 部署類型,請參閱 Deployment types for Microsoft Foundry Models

如何使用此頁面

請使用本文中的表格,選擇支援的部署類型、模型版本及 Azure 區域組合。

  • 部署類型:使用分頁選擇你打算使用的部署類型(標準或配置型)。
  • RegionRegion欄位列出你部署模型的Azure區域。
  • 可用性指標
    • ✅:支持。
    • 空白格或 -:不支援。

選擇一個模型

根據經紀人的需求選擇車型:

  • GPT-5 家族 (GPT-5、GPT-5-MINI、GPT-5-Nano、GPT-5-Chat):針對複雜多步驟任務進行前沿規模推理。 進入需先行登記。
  • GPT-4.1 家族 (GPT-4.1、GPT-4.1-mini、GPT-4.1-nano):用於通用代理工作負載的成本效益模型。
  • GPT-4O系列 (GPT-4O、GPT-4O-MINI):具備視覺支援的多模態能力。
  • GPT-4 與 GPT-35-turbo:舊有型號,向下相容。

小提示

快速開始:大多數新代理商可於 2024-11-20swedencentraleastus2 部署 gpt-4o,採用全球標準部署。 這些區域在大多數情況下擁有廣泛的模型可用性與低延遲。

可用的模型

Foundry Agent Service 支援以下 Azure OpenAI 模型,涵蓋上述區域。

請記住,模型的可用性會因地區和雲端而異。 某些工具和功能需要最新的模型。 REST API 和 SDK 中提供下列模型。

備註

區域 gpt-5 gpt-5-mini GPT-5-Nano gpt-5-chat GPT-4.1 GPT-4.1-奈米 GPT-4.1-mini gpt-4o(05-13) GPT-4O(08-06) gpt-4o(11-20) gpt-4o-mini gpt-4 gpt-4-turbo
澳大利亞東部
brazilsouth(巴西南部)
canadaeast
eastus
eastus2
francecentral
德國西中部
italynorth
japaneast
挪威東部
southafricanorth
southcentralus
南印度
swedencentral
switzerlandnorth
uksouth
西歐
維斯特斯
westus3

非 OpenAI 模型

除了 Azure OpenAI 模型外,你也可以使用由 Azure 直接販售的模型。 這些模型提供特定使用情境的專業能力,例如確定性推理或高吞吐量產生。

直接由 Azure 銷售的型號:

  • MAI-DS-R1:確定性、精確度導向的推理。
  • GROK-4:用於複雜多步驟問題解決的前沿尺度推理。
  • grok-4-fast-reasoning:針對工作流程自動化最佳化的加速代理式推理。
  • grok-4-fast-non-reasoning:高輸送量、低延遲的生成與系統路由。
  • GROK-3:針對複雜系統層級的工作流程提供強而有力的推理。
  • Grok-3-mini:輕量化模型,優化於互動式、大量使用情境。
  • Llama-3.3-70B-Instruct:企業問答、決策支援及系統協調的多功能模型。
  • Llama-4-Maverick-17B-128E-Instruct-FP8:FP8 優化模型,提供快速且具成本效益的推理。
  • DeepSeek-V3-0324:跨文本與影像的多模態理解。
  • DeepSeek-V3.1:強化多模態推理與接地檢索。
  • DeepSeek-R1-0528:進階長式與多步驟推理。
  • GPT-OSS-120b:支持透明度與可重現性的開放生態系統模型。

在 Foundry 入口網站查看所有代理支援模型

欲在 Foundry 入口網站查看完整支援型號清單:

  1. 登入 Microsoft Foundry。 確定新鑄造廠的開關是關閉的。 這些步驟指的是Foundry (classic)
  2. 請前往 模型目錄
  3. 能力 篩選模型並選擇 支援代理

驗證模型支援

模型的可用性會隨時間改變。

  • 要驗證你能部署到專案和區域的方案,請使用前一節所述的 Foundry 入口網站模型經驗。
  • 如果你使用配置過的吞吐量,務必確保目標區域內有可用的配置處理吞吐量單元(PTU)。 背景請參見 「配置吞吐量」。

故障排除

你所在地區沒有某個型號或版本

  • 確認你選對了部署類型的標籤。
  • 試試看支援該型號和版本的其他區域。
  • 如果你用的是 GPT-5 模型,請確保你的訂閱有權限。 部分車型需註冊。

檔案搜尋功能無法提供

  • 義大利北部和巴西南部無法提供檔案搜尋功能。 選擇支援的區域,或使用其他工具。

配置吞吐量部署失敗