備註
本文件指的是 Microsoft Foundry(新) 入口網站。
本文列出 Azure 直接銷售的 Microsoft Foundry 模型及其功能、 部署類型與可用區域,不包括 已棄用及舊有模型。 欲查看 Foundry Agent Service 支援的 Azure OpenAI 模型列表,請參閱 Agent Service 支援的模型。
Azure 直接銷售的模型包含所有 Azure OpenAI 模型,以及來自頂級提供者的特定所選模型。
根據你在 Microsoft Foundry 中使用的 專案 類型,你會看到不同的模型選擇。 具體來說,如果你使用 Foundry 資源上建置的 Foundry 專案,你會看到可用來標準部署到 Foundry 資源的模型。 或者,如果你使用由 Foundry 樞紐託管的基於樞紐的專案,你會看到可供部署到託管運算及無伺服器 API 的模型。 這些模型選擇經常會重疊,因為許多模型支援多個部署選項。
Foundry 模型可用於標準部署至 Foundry 資源。
欲了解更多 Azure 直接販售的 Foundry 模型屬性,請參閱 探索 Foundry 模型。
備註
Azure 直接銷售的 Foundry 模型也包含下列頂級模型提供者的選取模型:
- 黑森林實驗室:
FLUX.1-Kontext-pro,FLUX-1.1-pro - Cohere:
Cohere-command-a,embed-v-4-0 - 深度搜尋:
DeepSeek-V3.1、DeepSeek-V3-0324、、DeepSeek-R1-0528DeepSeek-R1 - Meta:
Llama-4-Maverick-17B-128E-Instruct-FP8、Llama-3.3-70B-Instruct - Microsoft:
MAI-DS-R1,model-router - 密斯特拉爾:
mistral-document-ai-2505,Mistral-Large-3 - xAI:
grok-code-fast-1、grok-3、、grok-3-mini、grok-4-fast-reasoning、、grok-4-fast-non-reasoning、grok-4
若要瞭解這些模型,請切換至本文頂端的其他 模型集合 。
Azure OpenAI 在 Microsoft Foundry 模型中
Azure OpenAI 是由一組具有不同功能和價格點的各種模型所提供。 模型可用性會依區域和雲端而有所不同。 如需 Azure Government 模型可用性,請參閱 Azure Government 中的 Azure OpenAI。
| Models | Description |
|---|---|
| GPT-5.1 系列 |
NEWgpt-5.1、、gpt-5.1-chat、 gpt-5.1-codexgpt-5.1-codex-mini |
| Sora | 新 索拉-2 |
| GPT-5 系列 | GPT-5、GPT-5-迷你、GPT-5-奈米、GPT-5-聊天 |
| gpt-oss | 開放權重推理模型 |
| codex-mini | 經過微調的 o4-mini 版本。 |
| GPT-4.1 系列 | gpt-4.1、gpt-4.1-mini、gpt-4.1-nano |
| computer-use-preview | 定型以搭配回應 API 計算機使用工具使用的實驗模型。 |
| o 系列模型 | 具有進階問題解決和提高專注力和能力的推理模型。 |
| GPT-4o、GPT-4o 迷你和 GPT-4 Turbo | 具有多模式版本的功能 Azure OpenAI 模型,可以接受文字和影像作為輸入。 |
| GPT-4 | 一組在 GPT-3.5 上獲得改善的模型,可以了解及產生自然語言和程式碼。 |
| GPT-3.5 | 一組在 GPT-3 上獲得改善的模型,可以了解及產生自然語言和程式碼。 |
| Embeddings | 一組可將文字轉換成數值向量形式,以輔助文字相似性的模型。 |
| 映射產生 | 可從自然語言產生原始影像的一系列模型。 |
Video generation |
可以根據文字指令產生原始視訊場景的模型。 |
| 音訊 | 一系列用於語音轉文字、翻譯和文字轉語音的模型。 GPT-4o 音訊模型支援低延遲的語音輸入、語音輸出互動或音訊生成。 |
GPT-5.1
區域可用性
| 型號 | 區域 |
|---|---|
gpt-5.1 |
美國東部2及瑞典中部(全球標準及DataZone標準) |
gpt-5.1-chat |
美國東部 2 和瑞典中部 (全域標準) |
gpt-5.1-codex |
美國東部 2 和瑞典中部 (全域標準) |
gpt-5.1-codex-mini |
美國東部 2 和瑞典中部 (全域標準) |
gpt-5.1-codex-max |
美國東部 2 和瑞典中部 (全域標準) |
存取權會根據Microsoft的資格準則來授與。 先前申請並獲得有限模式存取權的客戶無需重新申請,因為其核准的訂閱將在模型發佈時自動獲得存取權。
| 型號識別碼 | Description | 內容視窗 | 最大輸出代幣數量 | 定型資料 (最多) |
|---|---|---|---|---|
gpt-5.1 (2025-11-13) |
-
推理 - 聊天完成 API。 - 回應 API。 - 結構化輸出。 - 文字和影像處理。 - 函式、工具、平行工具呼叫。 - 功能的完整摘要。 |
400,000 輸入:272,000 輸出:128,000 |
128,000 | 2024 年 9 月 30 日 |
gpt-5.1-chat (2025-11-13) |
-
推理 - 聊天完成 API。 - 回應 API。 - 結構化輸出 - 函式、工具、平行工具呼叫。 |
128,000 輸入:111,616 輸出:16,384 |
16,384 | 2024 年 9 月 30 日 |
gpt-5.1-codex (2025-11-13) |
- 僅限回應 API。 - 文字和圖像處理 - 結構化輸出。 - 函式、工具、平行工具呼叫。 - 功能的完整摘要 - 針對 Codex CLI 和 Codex VS Code 擴展進行了優化 |
400,000 輸入:272,000 輸出:128,000 |
128,000 | 2024 年 9 月 30 日 |
gpt-5.1-codex-mini (2025-11-13) |
- 僅限回應 API。 - 文字和圖像處理 - 結構化輸出。 - 文字和影像處理。 - 函式、工具、平行工具呼叫。 - 功能的完整摘要 - 針對 Codex CLI 和 Codex VS Code 擴展進行了優化 |
400,000 輸入:272,000 輸出:128,000 |
128,000 | 2024 年 9 月 30 日 |
gpt-5.1-codex-max (2025-12-04) |
- 僅限回應 API。 - 文字和圖像處理 - 結構化輸出。 - 文字和影像處理。 - 函式、工具、平行工具呼叫。 - 功能的完整摘要 - 針對 Codex CLI 和 Codex VS Code 擴展進行了優化 |
400,000 輸入:272,000 輸出:128,000 |
128,000 | 2024 年 9 月 30 日 |
這很重要
gpt-5.1reasoning_effort預設為none。 從先前的推理模型升級到gpt-5.1時,請記住,如果您希望進行推理,您可能需要更新程式碼以明確傳遞層級reasoning_effort。gpt-5.1-chat新增內建推理功能。 如同其他 推理模型 一樣,它不支援像temperature這樣的參數。 如果您將gpt-5-chat(這不是推理模型)升級到gpt-5.1-chat時,請確保從程式碼中刪除推理模型不支援的任何自訂參數,例如temperature。gpt-5.1-codex-max新增對 設定reasoning_effortxhigh的支援。 推理運算none不支援gpt-5.1-codex-max。
GPT-5
區域可用性
| 型號 | 區域 |
|---|---|
gpt-5 (2025-08-07) |
請參閱模型數據表。 |
gpt-5-mini (2025-08-07) |
請參閱模型數據表。 |
gpt-5-nano (2025-08-07) |
請參閱模型數據表。 |
gpt-5-chat (2025-08-07) |
請參閱模型數據表。 |
gpt-5-chat (2025-10-03) |
美國東部2 (全球標準) 和瑞典中部 (全球標準) |
gpt-5-codex (2025-09-11) |
美國東部2 (全球標準) 和瑞典中部 (全球標準) |
gpt-5-pro (2025-10-06) |
美國東部2 (全球標準) 和瑞典中部 (全球標準) |
gpt-5-mini、gpt-5-nano和gpt-5-chat不需要註冊。
存取權會根據Microsoft的資格準則來授與。 先前已套用並收到 存取 o3權的客戶不需要重新套用,因為其核准的訂用帳戶會在模型發行時自動獲得存取權。
| 型號識別碼 | Description | 內容視窗 | 最大輸出代幣數量 | 定型資料 (最多) |
|---|---|---|---|---|
gpt-5 (2025-08-07) |
-
推理 - 聊天完成 API。 - 回應 API。 - 結構化輸出。 - 文字和影像處理。 - 函式、工具、平行工具呼叫。 - 功能的完整摘要。 |
400,000 輸入:272,000 輸出:128,000 |
128,000 | 2024 年 9 月 30 日 |
gpt-5-mini (2025-08-07) |
-
推理 - 聊天完成 API。 - 回應 API。 - 結構化輸出。 - 文字和影像處理。 - 函式、工具、平行工具呼叫。 - 功能的完整摘要。 |
400,000 輸入:272,000 輸出:128,000 |
128,000 | 2024 年 5 月 31 日 |
gpt-5-nano (2025-08-07) |
-
推理 - 聊天完成 API。 - 回應 API。 - 結構化輸出。 - 文字和影像處理。 - 函式、工具、平行工具呼叫。 - 功能的完整摘要。 |
400,000 輸入:272,000 輸出:128,000 |
128,000 | 2024 年 5 月 31 日 |
gpt-5-chat (2025-08-07)預覽 |
- 聊天完成 API。 - 回應 API。 - 輸入:文字/圖像 - 輸出:僅限文字 |
128,000 | 16,384 | 2024 年 9 月 30 日 |
gpt-5-chat (2025-10-03)預展1 |
- 聊天完成 API。 - 回應 API。 - 輸入:文字/圖像 - 輸出:僅限文字 |
128,000 | 16,384 | 2024 年 9 月 30 日 |
gpt-5-codex (2025-09-11) |
- 僅限回應 API。 - 輸入:文字/圖像 - 輸出:僅限文字 - 結構化輸出。 - 文字和影像處理。 - 函式、工具、平行工具呼叫。 - 功能的完整摘要 - 針對 Codex CLI 和 Codex VS Code 擴展進行了優化 |
400,000 輸入:272,000 輸出:128,000 |
128,000 | - |
gpt-5-pro (2025-10-06) |
-
推理 - 回應 API。 - 結構化輸出。 - 文字和影像處理。 - 功能和工具 - 功能的完整摘要。 |
400,000 輸入:272,000 輸出:128,000 |
128,000 | 2024 年 9 月 30 日 |
備註
1gpt-5-chat 個版本 2025-10-03 引入了針對情緒智商和心理健康能力的顯著增強。 此升級整合了專門的資料集與精煉的回應策略,以提升模型的能力如下:
- 更準確地理解和解釋情感背景,實現細緻入微且富有同理心的互動。
- 在與心理健康相關的對話中提供支持性、負責任的回應,確保敏感性並遵守最佳實踐。
這些改進旨在使 GPT-5-chat 在情感基調和幸福感考慮至關重要的場景中更具上下文感知、以人為本和可靠。
gpt-oss
區域可用性
| 型號 | 區域 |
|---|---|
gpt-oss-120b |
所有 Azure OpenAI 區域 |
能力
| 型號識別碼 | Description | 內容視窗 | 最大輸出代幣數量 | 定型資料 (最多) |
|---|---|---|---|---|
gpt-oss-120b (預覽) |
- 僅限文字輸入/文字輸出 - 聊天完成 API - 串流 - 函式呼叫 - 結構化輸出 - 推理 - 適用於部署1 和透過受控計算 |
131,072 | 131,072 | 2024 年 5 月 31 日 |
gpt-oss-20b (預覽) |
- 僅限文字輸入/文字輸出 - 聊天完成 API - 串流 - 函式呼叫 - 結構化輸出 - 推理 - 可透過受控計算和 Foundry Local 取得 |
131,072 | 131,072 | 2024 年 5 月 31 日 |
1 與其他 Azure OpenAI 模型 gpt-oss-120b 不同,部署模型需要 Foundry 專案 。
使用程式碼部署
az cognitiveservices account deployment create \
--name "Foundry-project-resource" \
--resource-group "test-rg" \
--deployment-name "gpt-oss-120b" \
--model-name "gpt-oss-120b" \
--model-version "1" \
--model-format "OpenAI-OSS" \
--sku-capacity 10 \
--sku-name "GlobalStandard"
GPT-4.1 系列
區域可用性
| 型號 | 區域 |
|---|---|
gpt-4.1 (2025-04-14) |
請參閱模型數據表。 |
gpt-4.1-nano (2025-04-14) |
請參閱模型數據表。 |
gpt-4.1-mini (2025-04-14) |
請參閱模型數據表。 |
能力
這很重要
已知問題會影響所有 GPT 4.1 系列模型。 超過 300,000 個令牌的大型工具或函數調用定義會導致失敗,即使未達到模型的 100 萬個令牌內容限制也一樣。
這些錯誤可能會根據 API 呼叫和基礎承載特性而有所不同。
以下是聊天完成 API 的錯誤訊息:
Error code: 400 - {'error': {'message': "This model's maximum context length is 300000 tokens. However, your messages resulted in 350564 tokens (100 in the messages, 350464 in the functions). Please reduce the length of the messages or functions.", 'type': 'invalid_request_error', 'param': 'messages', 'code': 'context_length_exceeded'}}Error code: 400 - {'error': {'message': "Invalid 'tools[0].function.description': string too long. Expected a string with maximum length 1048576, but got a string with length 2778531 instead.", 'type': 'invalid_request_error', 'param': 'tools[0].function.description', 'code': 'string_above_max_length'}}
以下是回應 API 的錯誤訊息:
Error code: 500 - {'error': {'message': 'The server had an error processing your request. Sorry about that! You can retry your request, or contact us through an Azure support request at: https://go.microsoft.com/fwlink/?linkid=2213926 if you keep seeing this error. (Please include the request ID d2008353-291d-428f-adc1-defb5d9fb109 in your email.)', 'type': 'server_error', 'param': None, 'code': None}}
| 型號識別碼 | Description | 語境視窗 | 最大輸出字元上限 | 訓練資料(最多) |
|---|---|---|---|---|
gpt-4.1 (2025-04-14) |
- 文字和影像輸入 - 文字輸出 - 對話補全 API - 回應 API - 串流 - 函式呼叫 - 結構化輸出 (聊天完成) |
- 1,047,576 - 128,000(已配置的受控部署) - 300,000 (批次部署) |
32,768 | 2024 年 5 月 31 日 |
gpt-4.1-nano (2025-04-14) |
- 文字和影像輸入 - 文字輸出 - 對話補全 API - 回應 API - 串流 - 函式呼叫 - 結構化輸出 (聊天完成) |
- 1,047,576 - 128,000(已配置的受控部署) - 300,000 (批次部署) |
32,768 | 2024 年 5 月 31 日 |
gpt-4.1-mini (2025-04-14) |
- 文字和影像輸入 - 文字輸出 - 對話補全 API - 回應 API - 串流 - 函式呼叫 - 結構化輸出 (聊天完成) |
- 1,047,576 - 128,000(已配置的受控部署) - 300,000 (批次部署) |
32,768 | 2024 年 5 月 31 日 |
computer-use-preview
為了搭配回應 API 電腦使用工具使用而訓練的實驗模型。
它可與第三方連結庫搭配使用,以允許模型控制滑鼠和鍵盤輸入,同時從目前環境的螢幕快照取得內容。
謹慎
我們不建議在生產環境中使用預覽模型。 我們將將預覽模型的所有部署升級至未來的預覽版本,或升級為最新穩定且正式運作的版本。 指定預覽的模型不會遵循標準的 Azure OpenAI 模型生命週期。
需要註冊才能存取 computer-use-preview。 存取權會根據Microsoft的資格準則授與。 具有其他有限存取模型存取權的客戶仍然需要要求此模型的存取權。
若要要求存取,請移至 computer-use-preview 有限的存取模型應用程式。 一旦獲得存取權,您必須佈署模型。
區域可用性
| 型號 | 區域 |
|---|---|
computer-use-preview |
請參閱模型數據表。 |
能力
| 型號識別碼 | Description | 語境視窗 | 最大輸出字元上限 | 訓練資料(最多) |
|---|---|---|---|---|
computer-use-preview (2025-03-11) |
與 回應 API 電腦使用工具搭配使用的特製化模型 -工具 - 串流 - 文字(輸入/輸出) - 影像(輸入) |
8,192 | 1,024 | 2023 年 10 月 |
o 系列模型
Azure OpenAI o 系列模型的設計目的是要解決專注度和功能增加的推理和解決問題工作。 相較於先前的反覆項目,這些模型會花更多的時間處理和了解使用者的要求,使其在科學、程式代碼和數學等領域非常強大。
| 型號識別碼 | Description | 要求上限 (權杖) | 訓練資料(最多) |
|---|---|---|---|
codex-mini (2025-05-16) |
經過微調的版本 o4-mini。 - 回應 API。 - 結構化輸出。 - 文字和影像處理。 - 函式和工具。 功能的完整摘要。 |
輸入:200000 輸出:100,000 |
2024 年 5 月 31 日 |
o3-pro (2025-06-10) |
-
回應 API。 - 結構化輸出。 - 文字和影像處理。 - 函式和工具。 功能的完整摘要。 |
輸入:200000 輸出:100,000 |
2024 年 5 月 31 日 |
o4-mini (2025-04-16) |
-
新的 推理模型,提供 增強的推理能力。 - 聊天完成 API。 - 回應 API。 - 結構化輸出。 - 文字和影像處理。 - 函式和工具。 功能的完整摘要。 |
輸入:200000 輸出:100,000 |
2024 年 5 月 31 日 |
o3 (2025-04-16) |
-
新的 推理模型,提供 增強的推理能力。 - 聊天完成 API。 - 回應 API。 - 結構化輸出。 - 文字和影像處理。 - 函式、工具、平行工具呼叫。 功能的完整摘要。 |
輸入:200000 輸出:100,000 |
2024 年 5 月 31 日 |
o3-mini (2025-01-31) |
-
增強的推理能力。 - 結構化輸出。 - 純文字處理。 - 函式和工具。 |
輸入:200000 輸出:100,000 |
2023 年 10 月 |
o1 (2024-12-17) |
-
增強的推理能力。 - 結構化輸出。 - 文字和影像處理。 - 函式和工具。 |
輸入:200000 輸出:100,000 |
2023 年 10 月 |
o1-preview (2024-09-12) |
較舊的預覽版本。 | 輸入:128,000 輸出:32,768 |
2023 年 10 月 |
o1-mini (2024-09-12) |
o1 系列中更快且更具成本效益的選項,適用於需要速度和較低資源耗用量的編碼工作。 - 預設提供全域標準部署。 - 標準(地區)部署目前僅適用於在有限存取版本中收到存取 o1-preview 權的選取客戶。 |
輸入:128,000 輸出:65,536 |
2023 年 10 月 |
若要深入瞭解進階 o 系列模型,請參閱 開始使用推理模型。
區域可用性
| 型號 | 區域 |
|---|---|
codex-mini |
美國東部 2 和瑞典中部 (全域標準)。 |
o3-pro |
美國東部 2 和瑞典中部 (全域標準)。 |
o4-mini |
請參閱模型數據表。 |
o3 |
請參閱模型數據表。 |
o3-mini |
請參閱模型數據表。 |
o1 |
請參閱模型數據表。 |
o1-preview |
請參閱模型數據表。 此模型僅適用於在原始有限存取權中授與存取權的客戶。 |
o1-mini |
請參閱模型數據表。 |
GPT-4o 與 GPT-4 Turbo
GPT-4o 整合單一模型中的文字和影像,讓它可以同時處理多個數據類型。 這種多模態方法可增強人類與電腦互動的精準度和回應性。 GPT-4o 在英文文字與編碼任務上可媲美 GPT-4 Turbo,同時在非英文語言任務和視覺任務中展現卓越效能,並設立 AI 能力的新標準。
GPT-4 和 GPT-4 Turbo 模型
這些模型只能與聊天完成 API 搭配使用。
請參閱 模型版本 ,以瞭解 Azure OpenAI 如何處理模型版本升級。 請參閱 使用模型 來瞭解如何檢視及設定 GPT-4 部署的模型版本設定。
| 型號識別碼 | Description | 要求上限 (權杖) | 訓練資料(最多) |
|---|---|---|---|
gpt-4o (2024-11-20) GPT-4o (Omni) |
- 結構化輸出。 - 文字和影像處理。 - JSON 模式。 - 平行函式呼叫。 - 增強精確度和回應性。 - 與具備視覺功能的 GPT-4 Turbo 在英語文字和編碼工作上同位。 - 在非英文語言和視覺工作中具有優越的效能。 - 增強創意寫作能力。 |
輸入:128,000 輸出:16,384 |
2023 年 10 月 |
gpt-4o (2024-08-06)GPT-4o (Omni) |
- 結構化輸出。 - 文字和影像處理。 - JSON 模式。 - 平行函式呼叫。 - 增強精確度和回應性。 - 與具備視覺功能的 GPT-4 Turbo 在英語文字和編碼工作上同位。 - 在非英文語言和視覺工作中具有優越的效能。 |
輸入:128,000 輸出:16,384 |
2023 年 10 月 |
gpt-4o-mini (2024-07-18)GPT-4o 迷你 |
- 快速、便宜、能夠取代 GPT-3.5 Turbo 系列模型的理想模型。 - 文字和影像處理。 - JSON 模式。 - 平行函式呼叫。 |
輸入:128,000 輸出:16,384 |
2023 年 10 月 |
gpt-4o (2024-05-13)GPT-4o (Omni) |
- 文字和影像處理。 - JSON 模式。 - 平行函式呼叫。 - 增強精確度和回應性。 - 與具備視覺功能的 GPT-4 Turbo 在英語文字和編碼工作上同位。 - 在非英文語言和視覺工作中具有優越的效能。 |
輸入:128,000 輸出:4,096 |
2023 年 10 月 |
gpt-4 (turbo-2024-04-09)GPT-4 Turbo with Vision(具備視覺功能) |
新普遍可用的模型。 - 取代所有先前的 GPT-4 預覽模型 ( vision-preview、1106-Preview、0125-Preview)。 - 功能可用性 目前不同,視輸入的方法和部署類型而定。 |
輸入:128,000 輸出:4,096 |
2023 年 12 月 |
謹慎
我們不建議您在生產環境中使用預覽模型。 我們將將預覽模型的所有部署升級至未來的預覽版本,或升級為最新穩定且正式運作的版本。 指定預覽的模型不會遵循標準的 Azure OpenAI 模型生命週期。
GPT-3.5
GPT-3.5 模型可以了解並產生自然語言或程式碼。 GPT-3.5 系列中最有能力且符合成本效益的模型是 GPT-3.5 Turbo,其已針對聊天優化,也適用於傳統的完成工作。 GPT-3.5 Turbo 可與聊天完成 API 搭配使用。 當您使用完成 API 而非聊天完成 API 時,GPT-3.5 Turbo Instruct 有與 text-davinci-003 類似的功能。 建議您使用 GPT-3.5 Turbo 和 GPT-3.5 Turbo Instruct,而不是舊版 GPT-3.5 和 GPT-3 模型。
| 型號識別碼 | Description | 要求上限 (權杖) | 訓練資料(最多) |
|---|---|---|---|
gpt-35-turbo (0125) 新 |
- JSON 模式。 - 平行函式呼叫。 - 可重現的輸出(預覽)。 - 以要求的格式回應時,精確度較高。 - 包含針對非英文語言函式呼叫文字編碼問題的錯誤修正。 |
輸入:16,385 輸出:4,096 |
2021 年 9 月 |
gpt-35-turbo (1106) |
較舊的一般可用模型。 - JSON 模式。 - 平行函式呼叫。 - 可重現的輸出(預覽)。 |
輸入:16,385 輸出:4,096 |
2021 年 9 月 |
gpt-35-turbo-instruct (0914) |
僅限完成端點。 - 取代舊版完成模型。 |
4,097 | 2021 年 9 月 |
若要深入瞭解如何與 GPT-3.5 Turbo 和聊天完成 API 互動,請參閱我們的 深入作說明文章。
嵌入技術
text-embedding-3-large 是最新且功能最強的內嵌模型。 您無法在內嵌模型之間升級。 若要從 使用 text-embedding-ada-002 移至 text-embedding-3-large,您需要產生新的內嵌。
text-embedding-3-largetext-embedding-3-smalltext-embedding-ada-002
OpenAI 報告顯示,大型和小型第三代內嵌模型在 MIRACL 基準下提供更佳的平均多語言擷取效能。 它們仍會使用 MTEB 基準來維護英文工作的效能。
| 評估基準 | text-embedding-ada-002 |
text-embedding-3-small |
text-embedding-3-large |
|---|---|---|---|
| MIRACL 平均值 | 31.4 | 44.0 | 54.9 |
| MTEB 平均值 | 61.0 | 62.3 | 64.6 |
第三代內嵌模型支援透過新的 dimensions 參數減少內嵌的大小。 一般而言,從計算、記憶體和記憶體的觀點來看,較大的內嵌成本會更高。 當您可以調整維度數目時,您可以更充分掌控整體成本和效能。
dimensions 參數並非在 OpenAI 1.x Python 程式庫的所有版本中都受到支持。 若要利用此參數,建議您升級至最新版本: pip install openai --upgrade。
OpenAI 的 MTEB 基準檢驗發現,即使第三代模型的維度縮減為小於 1,536 個維度 text-embeddings-ada-002,效能仍略有改善。
影像產生模型
影像產生模型會從使用者提供的文字提示產生影像。 GPT-image-1 系列模型處於有限存取預覽階段。 DALL-E 3 通常可搭配 REST API 使用。 包含用戶端 SDK 的 DALL-E 2 和 DALL-E 3 處於預覽狀態。
需要註冊才能訪問 gpt-image-1 或 gpt-image-1-mini。 存取權會根據Microsoft的資格準則授與。 具有其他有限存取模型存取權的客戶仍然需要要求此模型的存取權。
若要要求存取,請移至 gpt-image-1 有限的存取模型應用程式。 一旦獲得存取權,您必須佈署模型。
區域可用性
| 型號 | 區域 |
|---|---|
dall-e-3 |
美國東部 Australia East 瑞典中部 |
gpt-image-1 |
美國西部 3 (全域標準) 美國東部 2 (全球標準) 阿聯酋北部(全球標準) 波蘭中部(全球標準) 瑞典中部(全球標準) |
gpt-image-1-mini |
美國西部 3 (全域標準) 美國東部 2 (全球標準) 阿聯酋北部(全球標準) 波蘭中部(全球標準) 瑞典中部(全球標準) |
影片產生模型
Sora 是OpenAI的AI模型,可從文字指示建立真實且富有想像力的視訊場景。 Sora 處於預覽狀態。
區域可用性
| 型號 | 區域 |
|---|---|
sora |
美國東部 2 (全球標準) 瑞典中部(全球標準) |
sora-2 |
美國東部 2 (全球標準) 瑞典中部(全球標準) |
音頻模型
Azure OpenAI 中的音訊模型可透過 realtime、 completions和 audio API 取得。
GPT-4o 語音模型
GPT-4o 音訊模型是 GPT-4o 模型系列的一部分,並支援低延遲、 語音輸入、語音輸出 交談互動或音訊產生。
謹慎
我們不建議在生產環境中使用預覽模型。 我們將將預覽模型的所有部署升級至未來的預覽版本,或升級為最新穩定且正式運作的版本。 指定預覽的模型不會遵循標準的 Azure OpenAI 模型生命週期。
下表提供最大請求令牌和訓練資料的詳細資訊:
| 型號識別碼 | Description | 要求上限 (權杖) | 訓練資料(最多) |
|---|---|---|---|
gpt-4o-mini-audio-preview (2024-12-17) GPT-4o 音訊 |
用於音訊和文字生成的音訊模型。 | 輸入:128,000 輸出:16,384 |
2023 年 9 月 |
gpt-4o-audio-preview (2024-12-17) GPT-4o 音訊 |
用於音訊和文字生成的音訊模型。 | 輸入:128,000 輸出:16,384 |
2023 年 9 月 |
gpt-4o-realtime-preview (2025-06-03) GPT-4o 音訊 |
用於即時音訊處理的音訊模型。 | 輸入:128,000 輸出:4,096 |
2023 年 10 月 |
gpt-4o-realtime-preview (2024-12-17) GPT-4o 音訊 |
用於即時音訊處理的音訊模型。 | 輸入:128,000 輸出:4,096 |
2023 年 10 月 |
gpt-4o-mini-realtime-preview (2024-12-17) GPT-4o 音訊 |
用於即時音訊處理的音訊模型。 | 輸入:128,000 輸出:4,096 |
2023 年 10 月 |
gpt-realtime (2025 年 8 月 28 日) (GA)gpt-realtime-mini (2025-10-06)gpt-audio(2025年08月28日)gpt-audio-mini(2025年10月06日) |
用於即時音訊處理的音訊模型。 | 輸入:28,672 輸出:4,096 |
2023 年 10 月 |
若要比較所有區域中 GPT-4o 音訊模型的可用性,請參閱 models 數據表。
音訊應用程式介面
透過 API 的 /audio 音訊模型可用於語音轉換文字、翻譯和文字到語音轉換。
語音轉換文字模型
| 型號識別碼 | Description | 最大要求 (音訊檔案大小) |
|---|---|---|
whisper |
一般用途語音辨識模型。 | 25 MB |
gpt-4o-transcribe |
由 GPT-4o 提供的語音轉換文字模型。 | 25 MB |
gpt-4o-mini-transcribe |
由 GPT-4o mini 提供的語音轉換文字模型。 | 25 MB |
gpt-4o-transcribe-diarize |
具有自動語音辨識功能的語音轉文字模型。 | 25 MB |
語音翻譯模型
| 型號識別碼 | Description | 最大要求 (音訊檔案大小) |
|---|---|---|
whisper |
一般用途語音辨識模型。 | 25 MB |
文字到語音轉換模型 (預覽)
| 型號識別碼 | Description |
|---|---|
tts |
針對速度優化的文字到語音轉換模型。 |
tts-hd |
針對品質優化的文字到語音轉換模型。 |
gpt-4o-mini-tts |
GPT-4o mini 驅動的文字轉語音模型。 您可以引導語音以特定風格或語調說話。 |
如需詳細資訊,請參閱本文稍後的 音訊模型區域可用性 。
模型摘要資料表和區域可用性
依部署類型排序的模型
Azure OpenAI 可讓客戶選擇符合其商務和使用模式的裝載結構。 此服務提供兩種主要部署類型:
- 標準:具有全域部署選項,可全域路由傳送流量以提供更高的輸送量。
- 已布建:也有全球部署選項,可讓客戶在 Azure 全域基礎設施中購買和部署布建的吞吐量單位。
所有部署都可以執行完全相同的推斷作業,但計費、規模和效能大不相同。 若要深入瞭解 Azure OpenAI 部署類型,請參閱我們的 部署類型指南。
全域標準模型可用性
| 區域 | GPT-5.1,2025-11-13 | GPT-5.1-Chat, 2025-11-13 | GPT-5.1-Codex,2025-11-13 | GPT-5.1-Codex-mini,2025-11-13 | Gpt-5-Pro,2025年10月6日 | gpt-5, 2025-08-07 | gpt-5-mini, 2025-08-07 | gpt-5-nano, 2025-08-07 | GPT-5-chat, 2025-08-07 | GPT-5-Chat, 2025-10-03 | o3-pro, 2025-06-10 | codex-mini, 2025-05-16 | sora, 2025-05-02 | 型號路由器, 2025-08-07 | model-router, 2025-05-19 | 型號-路由器, 2025-11-18 | o3, 2025-04-16 | o4-mini, 2025-04-16 | gpt-image-1, 2025-04-15 | gpt-4.1, 2025-04-14 | gpt-4.1-nano, 2025-04-14 | gpt-4.1-mini, 2025-04-14 | 電腦使用預覽, 2025-03-11 | o3-mini, 2025-01-31 | o1, 2024-12-17 | o1-mini, 2024-09-12 | gpt-4o,2024-05-13 | gpt-4o,2024-08-06 | gpt-4o, 2024-11-20 | gpt-4o-mini, 2024-07-18 | text-embedding-3-small,1 | text-embedding-3-large,1 | text-embedding-ada-002,2 | gpt-4o-realtime-preview, 2024-12-17 | gpt-4o-realtime-preview, 2025-06-03 | gpt-4o-audio-preview, 2024-12-17 | gpt-4o-mini-realtime-preview, 2024-12-17 | gpt-4o-mini-audio-preview, 2024-12-17 | gpt-4o-transcribe, 2025-03-20 | gpt-4o-mini-tts, 2025-03-20 | gpt-4o-mini-transcribe, 2025-03-20 | GPT-5 Codex, 2025-09-15 | GPT-實時, 2025-08-28 | GPT-AUDIO-MINI,2025-10-06 | GPT-image-1-mini,2025-10-06 | GPT-realtime-mini,2025-10-06 | GPT-音頻, 2025-08-28 | SORA-2,2025-10-06 | o3-deep-research, 2025-06-26 | GPT-4O-轉錄-日記, 2025-10-15 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| australiaeast | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| brazilsouth(巴西南部) | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| canadacentral | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | ✅ | - | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| canadaeast | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| centralus | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | - | - |
| eastus | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | - | - | - | - |
| eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
| francecentral | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| 德國西中部 | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| italynorth | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| japaneast | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| koreacentral | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| northcentralus | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| 挪威東部 | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - |
| 波蘭中心 | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - |
| southafricanorth | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| southcentralus | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| southeastasia | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | - | - | ✅ | - | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| 南印度 | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| spaincentral | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| swedencentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
| switzerlandnorth | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| switzerlandwest | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | ✅ | - | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| uaenorth | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - |
| uksouth | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| westeurope | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| 維斯特斯 | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - |
| westus3 | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - |
備註
o3-deep-research 目前僅在 Foundry Agent Service 中提供。 若要深入瞭解,請參閱 深入研究工具指引。
下表不包含微調區域可用性資訊。 請參閱微調一節以取得這項資訊。
依端點的標準部署(區域)模型
聊天完成
| 區域 | o1-preview, 2024-09-12 | o1-mini, 2024-09-12 | gpt-4o,2024-05-13 | gpt-4o, 2024-11-20 | gpt-4o,2024-08-06 | gpt-4o-mini, 2024-07-18 | gpt-4,turbo-2024-04-09 | gpt-35-turbo,1106 | gpt-35-turbo, 0125 |
|---|---|---|---|---|---|---|---|---|---|
| australiaeast | - | - | - | ✅ | - | - | - | ✅ | ✅ |
| canadaeast | - | - | - | ✅ | - | - | - | ✅ | ✅ |
| eastus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
| eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
| francecentral | - | - | - | ✅ | - | - | - | ✅ | ✅ |
| japaneast | - | - | - | ✅ | - | - | - | - | ✅ |
| northcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
| 挪威東部 | - | - | - | ✅ | - | - | - | - | - |
| southcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
| 南印度 | - | - | - | ✅ | - | - | - | ✅ | ✅ |
| swedencentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| switzerlandnorth | - | - | - | ✅ | - | - | - | - | ✅ |
| uksouth | - | - | - | ✅ | - | - | - | ✅ | ✅ |
| westeurope | - | - | - | - | - | - | - | - | ✅ |
| 維斯特斯 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| westus3 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
備註
o1-mini 目前適用於所有客戶進行全域標準部署。
部分客戶已獲授予o1-mini標準版(區域部署)權限,作為o1-preview有限存取發布的一部分。 目前不會擴大對 o1-mini 標準 (區域) 部署的存取權。
若要瞭解 Azure OpenAI 如何處理模型版本升級,請參閱 模型版本。 若要瞭解如何檢視及設定 GPT-3.5 Turbo 部署的模型版本設定,請參閱 使用模型。
微調模型
備註
如果你在 Microsoft Foundry 專案中或外部使用 Azure OpenAI 模型,支援的微調區域可能會有所不同。
| 型號識別碼 | 標準訓練區域 | 全球培訓 | 要求上限 (權杖) | 訓練資料(最多) | Modality |
|---|---|---|---|---|---|
gpt-4o-mini (2024-07-18) |
美國中北部 瑞典中部 |
✅ | 輸入:128,000 輸出:16,384 訓練範例內容長度:65,536 |
2023年10月 | 文字到文字 |
gpt-4o (2024-08-06) |
美國東部 2 美國中北部 瑞典中部 |
✅ | 輸入:128,000 輸出:16,384 訓練範例內容長度:65,536 |
2023年10月 | 文字和視覺到文字 |
gpt-4.1 (2025-04-14) |
美國中北部 瑞典中部 |
✅ | 輸入:128,000 輸出:16,384 訓練範例內容長度:65,536 |
2024 年 5 月 | 文字和視覺到文字 |
gpt-4.1-mini (2025-04-14) |
美國中北部 瑞典中部 |
✅ | 輸入:128,000 輸出:16,384 訓練範例內容長度:65,536 |
2024 年 5 月 | 文字到文字 |
gpt-4.1-nano (2025-04-14) |
美國中北部 瑞典中部 |
✅ | 輸入:128,000 輸出:16,384 訓練範例上下文長度:32,768 |
2024 年 5 月 | 文字到文字 |
o4-mini (2025-04-16) |
美國東部 2 瑞典中部 |
✅ | 輸入:128,000 輸出:16,384 訓練範例內容長度:65,536 |
2024 年 5 月 | 文字到文字 |
備註
全域訓練針對每個語彙基元提供更實惠的訓練,但不提供資料落地。 目前可供下列區域中的 Azure OpenAI 資源使用:
- Australia East
- 巴西南部
- 加拿大中部
- 加拿大東部
- 美國東部
- 美國東部 2
- 法國中部
- 德國中西部
- 義大利北部
- 日本東部 (沒有視覺支援)
- 南韓中部
- 美國中北部
- 挪威東部
- 波蘭中部 (無4.1納米支援)
- 東南亞
- 南非北部
- 美國中南部
- 印度南部
- 西班牙中部
- 瑞典中部
- 瑞士西部
- 瑞士北部
- 英國南部
- 西歐
- 美國西部
- 美國西部 3
助理 (預覽)
針對助理,您需要支援模型和支援區域的組合。 某些工具和功能需要最新的模型。 以下模型可在 Assistants API、SDK 與 Foundry 中取得。 下表適用於標準部署。 如需布建輸送量單位可用性的相關信息,請參閱 布建的輸送量。 列出的模型和區域可以與 Assistants v1 和 v2 搭配使用。 如果下列區域支援 全域標準模型 ,您可以使用這些模型。
| 區域 | gpt-4o, 2024-05-13 | gpt-4o, 2024-08-06 | gpt-4o-mini, 2024-07-18 | gpt-4, 0613 | gpt-4,1106-Preview | gpt-4, 0125-Preview | gpt-4, turbo-2024-04-09 | gpt-4-32k, 0613 | gpt-35-turbo, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 | gpt-35-turbo-16k, 0613 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| australiaeast | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ |
| eastus | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | ✅ | - | ✅ | ✅ |
| eastus2 | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | ✅ | - | ✅ | ✅ |
| francecentral | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | ✅ |
| japaneast | - | - | - | - | - | - | - | - | ✅ | - | ✅ | ✅ |
| 挪威東部 | - | - | - | - | ✅ | - | - | - | - | - | - | - |
| 南印度 | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | - |
| swedencentral | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | ✅ |
| uksouth | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ |
| 維斯特斯 | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | - | ✅ | ✅ | - |
| westus3 | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | - | - | ✅ | - |
模型淘汰
如需模型淘汰的最新資訊,請參閱模型淘汰指南。
相關內容
備註
Azure 直接銷售的 Foundry 模型也包含所有 Azure OpenAI 模型。 若要瞭解這些模型,請切換至本文頂端的 Azure OpenAI 模型 集合。
由 Azure 直接銷售的黑森林實驗室模型
Black Forest Labs (BFL) 的圖像生成模型集合包括用於上下文生成和編輯的 FLUX.1 Kontext [pro] 和用於文本到圖像生成的 FLUX1.1 [pro]。
您可以透過 BFL 服務提供者 API 以及 映像/生成和映像/編輯端點來執行這些模型。
| 型號 | 類型 &; API 端點 | 能力 | 部署類型 (區域可用性) | 專案類型 |
|---|---|---|---|---|
| FLUX.1-Kontext-pro |
映射產生 - 圖像 API: https://<resource-name>/openai/deployments/{deployment-id}/images/generations 和 https://<resource-name>/openai/deployments/{deployment-id}/images/edits - BFL 服務提供者 API: <resource-name>/providers/blackforestlabs/v1/flux-kontext-pro?api-version=preview |
-
輸入: 文字和影像 (5,000 個語彙基元和 1 個影像) - 輸出: 一個影像 - 工具呼叫: 否 - 回應格式:影像 (PNG 和 JPG) - 主要特徵: 角色一致性,高級編輯 - 其他參數:(僅限提供者特定 API 中) seed, aspect ratio, , input_image, prompt_unsamplingsafety_tolerance, ,output_format |
- 全球標準 (所有區域) | Foundry,以中樞為核心 |
| FLUX-1.1-pro |
映射產生 - 圖像 API: https://<resource-name>/openai/deployments/{deployment-id}/images/generations - BFL 服務提供者 API: <resource-name>/providers/blackforestlabs/v1/flux-pro-1.1?api-version=preview |
-
輸入: 文字(5,000 個代幣和 1 張圖片) - 輸出: 一個影像 - 工具呼叫: 否 - 回應格式: 圖片(PNG 和 JPG) - 主要特徵: 推理速度快、提示依從性強、價格有競爭力、可擴展生成 - 其他參數:(僅限提供者特定 API 中) width, height, , prompt_unsampling, seedsafety_tolerance, ,output_format |
- 全球標準 (所有區域) | Foundry,以中樞為核心 |
| 型號 | 類型 &; API 端點 | 能力 | 部署類型 (區域可用性) |
|---|---|---|---|
FLUX.1-Kontext-pro |
映射產生 - 圖像 API: https://<resource-name>/openai/deployments/{deployment-id}/images/generations 和 https://<resource-name>/openai/deployments/{deployment-id}/images/edits - BFL 服務提供者 API: <resource-name>/providers/blackforestlabs/v1/flux-kontext-pro?api-version=preview |
-
輸入: 文字和影像 (5,000 個語彙基元和 1 個影像) - 輸出: 一個影像 - 工具呼叫: 否 - 回應格式:影像 (PNG 和 JPG) - 主要特徵: 角色一致性,高級編輯 - 其他參數:(僅限提供者特定 API 中) seed, aspect ratio, , input_image, prompt_unsamplingsafety_tolerance, ,output_format |
- 全球標準 (所有區域) |
FLUX-1.1-pro |
映射產生 - 圖像 API: https://<resource-name>/openai/deployments/{deployment-id}/images/generations - BFL 服務提供者 API: <resource-name>/providers/blackforestlabs/v1/flux-pro-1.1?api-version=preview |
-
輸入: 文字(5,000 個代幣和 1 張圖片) - 輸出: 一個影像 - 工具呼叫: 否 - 回應格式: 圖片(PNG 和 JPG) - 主要特徵: 推理速度快、提示依從性強、價格有競爭力、可擴展生成 - 其他參數:(僅限提供者特定 API 中) width, height, , prompt_unsampling, seedsafety_tolerance, ,output_format |
- 全球標準 (所有區域) |
請參閱 Microsoft Foundry 入口網站中的此模型收藏。
Cohere 模型由 Azure 直接銷售
Cohere 系列的模型包含已針對不同使用案例 (包括聊天完成和內嵌) 最佳化的各種模型。 Cohere 模型已針對各種使用案例 (包括推理、摘要及問題解答) 進行最佳化。
| 型號 | 類型 | 能力 | 部署類型 (區域可用性) | 專案類型 |
|---|---|---|---|---|
| Cohere-command-a | chat-completion |
-
輸入: 文字(131,072 個詞元) - 輸出: 文字(8,182 個令牌) - 語言: en、、fres、itdept-brjako、、 和 zh-cnar - 工具呼叫: 是的 - 回應格式: 文字、JSON |
- 全球標準 (所有區域) | Foundry,以中樞為核心 |
| embed-v-4-0 | embeddings |
-
輸入: 文字 (512 標記) 和影像 (2MM 像素) - 輸出: 向量 (256,512,1024,1536維) - 語言: en、、fres、itdept-brjako、、 和 zh-cnar |
- 全球標準 (所有區域) | Foundry,以中樞為核心 |
| 型號 | 類型 | 能力 | 部署類型 (區域可用性) |
|---|---|---|---|
Cohere-command-a |
chat-completion |
-
輸入: 文字(131,072 個詞元) - 輸出: 文字(8,182 個令牌) - 語言: en、、fres、itdept-brjako、、 和 zh-cnar - 工具呼叫: 是的 - 回應格式: 文字、JSON |
- 全球標準 (所有區域) |
embed-v-4-0 |
embeddings |
-
輸入: 文字 (512 標記) 和影像 (2MM 像素) - 輸出: 向量 (256,512,1024,1536維) - 語言: en、、fres、itdept-brjako、、 和 zh-cnar |
- 全球標準 (所有區域) |
請參閱 Foundry 入口網站的 Cohere 模型收藏。
Azure 直接銷售的 DeepSeek 模型
DeepSeek 系列模型包括 DeepSeek-R1,它透過使用逐步訓練程序 (例如語言、科學推理和編碼工作) 而擅長推理工作。
| 型號 | 類型 | 能力 | 部署類型 (區域可用性) | 專案類型 |
|---|---|---|---|---|
| 深度搜尋-V3.1 | chat-completion (具有推理內容) |
-
輸入: 文字(131,072 個詞元) - 輸出: (131,072 個令牌) - 語言: en 和 zh - 工具呼叫: 是的 - 回應格式: 文字、JSON |
- 全球標準 (所有區域) | Foundry,以中樞為核心 |
| DeepSeek-R1-0528 | chat-completion (具有推理內容) |
-
輸入: 文字(163,840 個令牌) - 輸出: (163,840 個令牌) - 語言: en 和 zh - 工具呼叫: 否 - 回應格式: 文字。 |
- 全球標準 (所有區域) - 全球佈建 (所有區域) |
Foundry,以中樞為核心 |
| DeepSeek-V3-0324 | chat-completion |
-
輸入: 文字(131,072 個詞元) - 輸出: (131,072 個令牌) - 語言: en 和 zh - 工具呼叫: 是的 - 回應格式: 文字、JSON |
- 全球標準 (所有區域) - 全球佈建 (所有區域) |
Foundry,以中樞為核心 |
| DeepSeek-R1 | chat-completion (具有推理內容) |
-
輸入: 文字(163,840 個令牌) - 輸出: (163,840 個令牌) - 語言: en 和 zh - 工具呼叫: 否 - 回應格式: 文字。 |
- 全球標準 (所有區域) - 全球佈建 (所有區域) |
Foundry,以中樞為核心 |
| 型號 | 類型 | 能力 | 部署類型 (區域可用性) |
|---|---|---|---|
DeepSeek-V3.1 |
chat-completion (具有推理內容) |
-
輸入: 文字(131,072 個詞元) - 輸出: (131,072 個令牌) - 語言: en 和 zh - 工具呼叫: 是的 - 回應格式: 文字、JSON |
- 全球標準 (所有區域) |
DeepSeek-R1-0528 |
chat-completion (具有推理內容) |
-
輸入: 文字(163,840 個令牌) - 輸出: (163,840 個令牌) - 語言: en 和 zh - 工具呼叫: 否 - 回應格式: 文字。 |
- 全球標準 (所有區域) - 全球佈建 (所有區域) |
DeepSeek-V3-0324 |
chat-completion |
-
輸入: 文字(131,072 個詞元) - 輸出: (131,072 個令牌) - 語言: en 和 zh - 工具呼叫: 是的 - 回應格式: 文字、JSON |
- 全球標準 (所有區域) - 全球佈建 (所有區域) |
DeepSeek-R1 |
chat-completion (具有推理內容) |
-
輸入: 文字(163,840 個令牌) - 輸出: (163,840 個令牌) - 語言: en 和 zh - 工具呼叫: 否 - 回應格式: 文字。 |
- 全球標準 (所有區域) - 全球佈建 (所有區域) |
請參閱 Foundry 入口網站中的此模型收藏。
Azure 直接銷售的 Meta 模型
Meta Llama 模型和工具是預先定型和微調的產生 AI 文字和影像推理模型的集合。 可調整 Meta 模型的範圍以包含:
- 例如應用於裝置和邊緣推斷的小型語言模型(SLM),包含 1B 和 3B 基礎模型及指令模型。
- 中型大型語言模型(LLM),例如 7B、8B 和 70B 基底和指示模型
- 高效能模型如 Meta Llama 3.1-405B 被用於合成資料生成和提煉使用案例。
| 型號 | 類型 | 能力 | 部署類型 (區域可用性) | 專案類型 |
|---|---|---|---|---|
| Llama-4-Maverick-17B-128E-Instruct-FP8 | chat-completion |
-
輸入: 文字與影像(1M 令牌) - 輸出: 文字(1M 令牌) - 語言: ar、en、fr、de、hi、id、it、pt、es、tl、th和vi - 工具呼叫: 否 - 回應格式: 文字 |
- 全球標準 (所有區域) | Foundry,以中樞為核心 |
| Llama-3.3-70B-Instruct | chat-completion |
-
輸入: 文字(128,000 個詞元) - 輸出: 文字(8,192 個令牌) - 語言: en、、、de、fr、itpthi、es、 和th - 工具呼叫: 否 - 回應格式: 文字 |
- 全球標準 (所有區域) | Foundry,以中樞為核心 |
| 型號 | 類型 | 能力 | 部署類型 (區域可用性) |
|---|---|---|---|
Llama-4-Maverick-17B-128E-Instruct-FP8 |
chat-completion |
-
輸入: 文字與影像(1M 令牌) - 輸出: 文字(1M 令牌) - 語言: ar、en、fr、de、hi、id、it、pt、es、tl、th和vi - 工具呼叫: 否 - 回應格式: 文字 |
- 全球標準 (所有區域) |
Llama-3.3-70B-Instruct |
chat-completion |
-
輸入: 文字(128,000 個詞元) - 輸出: 文字(8,192 個令牌) - 語言: en、、、de、fr、itpthi、es、 和th - 工具呼叫: 否 - 回應格式: 文字 |
- 全球標準 (所有區域) |
請參閱 Foundry 入口網站中的此模型收藏。 您也可以從合作夥伴和社群找到數個 Meta 模型。
由 Azure 直接銷售的 Microsoft 模型
Microsoft 模型包含多種模型群組,如 Model Router、MAI 模型、Phi 模型、醫療 AI 模型等。 請參閱 Foundry 入口網站中的 Microsoft 模型集合。 您也可以從合作夥伴和社群找到數個 Microsoft 模型。
| 型號 | 類型 | 能力 | 部署類型 (區域可用性) | 專案類型 |
|---|---|---|---|---|
| 型號-路由器1 | chat-completion | 更多細節請參考 模型路由器總覽。 - 輸入: 文字、圖片 - 輸出: 文字(最大輸出代幣數可變2) 上下文視窗: 200,0003 - 語言: en |
- 全球標準(「East US 2」,「Sweden Central」) - 資料區標準4 (東美國2號,瑞典中部) |
Foundry,以中樞為核心 |
| MAI-DS-R1 | chat-completion (具有推理內容) |
-
輸入: 文字(163,840 個令牌) - 輸出: (163,840 個令牌) - 語言: en 和 zh - 工具呼叫: 否 - 回應格式: 文字。 |
- 全球標準 (所有區域) | Foundry,以中樞為核心 |
| 型號 | 類型 | 能力 | 部署類型 (區域可用性) |
|---|---|---|---|
| 型號-路由器1 | chat-completion | 更多細節請參考 模型路由器總覽。 - 輸入: 文字、圖片 - 輸出: 文字(最大輸出代幣數可變2) 上下文視窗: 200,0003 - 語言: en |
- 全球標準(「East US 2」,「Sweden Central」) - 資料區標準4 (東美國2號,瑞典中部) |
MAI-DS-R1 |
chat-completion (具有推理內容) |
-
輸入: 文字(163,840 個令牌) - 輸出: (163,840 個令牌) - 語言: en 和 zh - 工具呼叫: 否 - 回應格式: 文字。 |
- 全球標準 (所有區域) |
1路由器型號版本2025-11-18。 早期版本2025-08-07 (和 2025-05-19)也有提供。
2個最大輸出標記 會依模型路由器中的底層模型而異。 例如,32,768GPT-4.1 series()、100,000(o4-mini)、128,000(gpt-5 reasoning models)、和16,384(gpt-5-chat)。
3 較大 的上下文視窗 與 部分 模型路由器底層模型相容。 這表示只有當提示符被路由到這些模型時,較大上下文的 API 呼叫才會成功。 否則,呼叫將會失敗。
4資料區標準 型路由器部署的計費最早於2025年11月1日開始。
Azure 直接銷售的 Mistral 模型
| 型號 | 類型 | 能力 | 部署類型 (區域可用性) | 專案類型 |
|---|---|---|---|---|
| Mistral-Large-3 | chat-completion |
-
輸入: 文字、圖片 - 輸出: 文字 - 語言: en、fr、de、es、it、pt、nl、zh、ja、ko、和ar - 工具呼叫: 是的 - 回應格式: 文字、JSON |
- 全球標準(美國西部3區) | Foundry |
| mistral-document-ai-2505 | 影像轉換文字 |
-
輸入: 影像或 PDF 頁面 (30 頁,最大 30MB PDF 檔案) - 輸出: 文字 - 語言: en - 工具呼叫: 無 - 回應格式: Text、JSON、Markdown |
- 全球標準 (所有區域) - 資料區域標準 (美國和歐盟) |
Foundry |
| 型號 | 類型 | 能力 | 部署類型 (區域可用性) |
|---|---|---|---|
Mistral-Large-3 |
chat-completion |
-
輸入: 文字、圖片 - 輸出: 文字 - 語言: en、fr、de、es、it、pt、nl、zh、ja、ko、和ar - 工具呼叫: 是的 - 回應格式: 文字、JSON |
- 全球標準(美國西部3區) |
mistral-document-ai-2505 |
影像轉換文字 |
-
輸入: 影像或 PDF 頁面 (30 頁,最大 30MB PDF 檔案) - 輸出: 文字 - 語言: en - 工具呼叫: 無 - 回應格式: Text、JSON、Markdown |
- 全球標準 (所有區域) - 資料區域標準 (美國和歐盟) |
請參見 Foundry 入口網站的 Mistral 模型收藏。 您也可以從合作夥伴和社群找到數個 Mistral 模型。
由 Azure 直接銷售的 xAI 模型
xAI 在 Foundry Models 中的 Grok 模型包含多元模型,旨在於不同企業領域中表現優異,具備不同能力與價格區間,包括:
Grok 3 是 Colossus 數據中心預先定型的非推理模型,專為商務使用案例量身打造,例如數據擷取、編碼和文字摘要,具有特殊的指示追蹤功能。 它支援 131,072 令牌內容視窗,讓它處理廣泛的輸入,同時維持一致性和深度,並善於跨網域和語言繪製連線。
Grok 3 Mini 是經過訓練的輕量型推理模型,可透過測試階段計算來解決代理程式、編碼、數學及深層科學方面的問題。 它也支援適用於理解程式碼基底和企業文件的 131,072 語彙基元內容視窗,並擅長在新環境中使用工具解決複雜的邏輯問題,提供原始推理追蹤,讓使用者在可調整的思考預算下進行檢查。
Grok Code Fast 1 是一種快速高效的推理模型,專為代理編碼應用而設計。 它對以編碼為中心的資料混合進行了預先訓練,然後對各種編碼工作和工具使用的展示,以及基於 xAI 安全原則的正確拒絕行為的展示進行了後訓練。 需要註冊才能訪問 grok-code-fast-1 模型。
Grok 4 Fast,一種效率優化的語言模型,可提供接近 Grok 4 的推理功能,同時顯著降低延遲和成本,並且可以完全繞過超快速應用程序的推理。 它經過安全有效的工具使用訓練,具有內建拒絕行為、固定的安全執行系統提示以及防止誤用的輸入過濾器。
Grok 4 是 xAI 的最新推理模型,具有先進的推理和工具使用功能,使其能夠在具有挑戰性的學術和行業基準測試中實現新的最先進的性能。 需要註冊才能存取 grok-4 模型。
| 型號 | 類型 | 能力 | 部署類型 (區域可用性) | 專案類型 |
|---|---|---|---|---|
| 格羅克-4 | chat-completion |
-
輸入: 文字、圖像(256,000 個代幣) - 輸出: 文字(8,192 個令牌) - 語言: en - 工具呼叫: 是 - 回應格式: 文字 |
- 全球標準 (所有區域) | Foundry,以中樞為核心 |
| grok-4-fast-reasoning | chat-completion |
-
輸入: 文字、圖像(2,000,000 個代幣) - 輸出: 文字(2,000,000 個代幣) - 語言: en - 工具呼叫: 是 - 回應格式: 文字 |
- 全球標準 (所有區域) - 資料區域標準 (美國) |
Foundry,以中樞為核心 |
| grok-4 快速非推理處理 | chat-completion |
-
輸入: 文字、圖像(2,000,000 個代幣) - 輸出: 文字(2,000,000 個代幣) - 語言: en - 工具呼叫: 是 - 回應格式: 文字 |
- 全球標準 (所有區域) - 資料區域標準 (美國) |
Foundry,以中樞為核心 |
| grok-code-fast-1 | chat-completion |
-
輸入: 文字 (256,000 個語彙基元) - 輸出: 文字(8,192 個令牌) - 語言: en - 工具呼叫: 是 - 回應格式: 文字 |
- 全球標準 (所有區域) | Foundry,以中樞為核心 |
| grok-3 | chat-completion |
-
輸入: 文字(131,072 個詞元) - 輸出: 文字(131,072 個令牌) - 語言: en - 工具呼叫: 是 - 回應格式: 文字 |
- 全球標準 (所有區域) - 資料區域標準 (美國) |
Foundry,以中樞為核心 |
| grok-3-mini | chat-completion |
-
輸入: 文字(131,072 個詞元) - 輸出: 文字(131,072 個令牌) - 語言: en - 工具呼叫: 是 - 回應格式: 文字 |
- 全球標準 (所有區域) - 資料區域標準 (美國) |
Foundry,以中樞為核心 |
| 型號 | 類型 | 能力 | 部署類型 (區域可用性) |
|---|---|---|---|
grok-4 |
chat-completion |
-
輸入: 文字、圖像(256,000 個代幣) - 輸出: 文字(8,192 個令牌) - 語言: en - 工具呼叫: 是 - 回應格式: 文字 |
- 全球標準 (所有區域) |
grok-4-fast-reasoning |
chat-completion |
-
輸入: 文字、圖像(2,000,000 個代幣) - 輸出: 文字(2,000,000 個代幣) - 語言: en - 工具呼叫: 是 - 回應格式: 文字 |
- 全球標準 (所有區域) - 資料區域標準 (美國) |
grok-4-fast-non-reasoning |
chat-completion |
-
輸入: 文字、圖像(2,000,000 個代幣) - 輸出: 文字(2,000,000 個代幣) - 語言: en - 工具呼叫: 是 - 回應格式: 文字 |
- 全球標準 (所有區域) - 資料區域標準 (美國) |
grok-code-fast-1 |
chat-completion |
-
輸入: 文字 (256,000 個語彙基元) - 輸出: 文字(8,192 個令牌) - 語言: en - 工具呼叫: 是 - 回應格式: 文字 |
- 全球標準 (所有區域) |
grok-3 |
chat-completion |
-
輸入: 文字(131,072 個詞元) - 輸出: 文字(131,072 個令牌) - 語言: en - 工具呼叫: 是 - 回應格式: 文字 |
- 全球標準 (所有區域) - 資料區域標準 (美國) |
grok-3-mini |
chat-completion |
-
輸入: 文字(131,072 個詞元) - 輸出: 文字(131,072 個令牌) - 語言: en - 工具呼叫: 是 - 回應格式: 文字 |
- 全球標準 (所有區域) - 資料區域標準 (美國) |
依部署類型建立區域可用性模型
Foundry Models 為您提供適合您的業務和使用模式的託管結構選擇。 此服務提供兩種主要部署類型:
- 標準:具有全域部署選項,可全域路由傳送流量以提供更高的輸送量。
- 佈建:也有全球部署選項,允許您跨 Azure 全球基礎設施購買和部署佈建吞吐量單位。
所有部署都會執行相同的推論操作,但計費、規模和效能不同。 欲了解更多部署類型的資訊,請參閱 Foundry 模型中的部署類型。
全域標準模型可用性
| 區域 | DeepSeek-R1-0528 | DeepSeek-R1 | DeepSeek-V3-0324 | 深度搜尋-V3.1 | FLUX.1-Kontext-pro | FLUX-1.1-pro | 格羅克-4 | grok-4-fast-reasoning | grok-4 快速非推理處理 | grok-code-fast-1 | grok-3 | grok-3-mini | Llama-4-Maverick-17B-128E-Instruct-FP8 | Llama-3.3-70B-Instruct | MAI-DS-R1 | mistral-document-ai-2505 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| australiaeast | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| brazilsouth(巴西南部) | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| canadaeast | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| eastus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| francecentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| 德國西中部 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| italynorth | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| japaneast | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| koreacentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| northcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| 挪威東部 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| 波蘭中心 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| southafricanorth | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| southcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| 南印度 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| spaincentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| swedencentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| switzerlandnorth | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| switzerlandwest | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| uaenorth | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| uksouth | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| westeurope | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| 維斯特斯 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| westus3 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
開啟和自定義模型
模型目錄提供了來自更廣泛提供商的更多模型選擇。 對於這些模型,你無法在 Microsoft Foundry 資源中使用標準部署選項,因為模型是以 API 形式提供的。 相反地,若要部署這些模型,您可能需要在其基礎結構上裝載它們、建立 AI 中樞,並提供基礎計算配額來裝載模型。
此外,這些模型可以開放存取或IP保護。 在這兩種情況下,你都必須在 Foundry 的託管運算產品中部署它們。 若要開始使用,請參閱 操作指南:部署至管理計算環境。
相關內容
- 來自合作夥伴和社群的 Foundry 模型 (部分內容可能是機器或 AI 翻譯)
- Foundry 模型部署概述
- 新增與配置模型至 Foundry Models。
- Foundry 模型中的部署類型 (部分內容可能是機器或 AI 翻譯)