共用方式為


Azure AI Foundry 模型中的 Azure OpenAI

Azure OpenAI 是由一組具有不同功能和價格點的各種模型所提供。 模型可用性會依區域和雲端而有所不同。 如需 Azure Government 模型可用性,請參閱 Azure Government OpenAI 服務

模型 描述
codex-mini 經過微調的 o4-mini 版本。
GPT-4.1 系列 Azure OpenAI 的最新模型版本
model-router 智慧模型能從多種基礎聊天模型中選擇,以回應特定提示。
電腦使用預覽 定型以搭配回應 API 計算機使用工具使用的實驗模型。
GPT-4.5 Preview 在各種文字和影像工作上表現最出色的最新 GPT 模型。
o 系列模型 具有進階問題解決和提高專注力和能力的推理模型
GPT-4o、GPT-4o mini、GPT-4 Turbo 最新且功能最強大的 Azure OpenAI 模型具有多模態版本,可同時接受文字和影像作為輸入。
GPT-4 一組在 GPT-3.5 上獲得改善的模型,可以了解及產生自然語言和程式碼。
GPT-3.5 一組在 GPT-3 上獲得改善的模型,可以了解及產生自然語言和程式碼。
內嵌 一組可將文字轉換成數值向量形式,以輔助文字相似性的模型。
映射產生 可從自然語言產生原始影像的一系列模型。
音訊 一系列用於語音轉文字、翻譯和文字轉語音的模型。 GPT-4o 音訊模型支援低延遲、「語音傳入、語音輸出」交談互動或音訊產生。

GPT 4.1 系列

區域可用性

模型 區域
gpt-4.1 (2025-04-14) 請參閱 模型數據表
gpt-4.1-nano (2025-04-14) 請參閱 模型數據表
gpt-4.1-mini (2025-04-14) 請參閱 模型數據表

能力

型號識別碼 描述 內容視窗 輸出權杖數上限 定型資料 (最多)
gpt-4.1 (2025-04-14) - 文字和影像輸入
- 文字輸出
- 聊天完成 API
- 回應 API
- 串流
- 函式呼叫
結構化輸出 (聊天完成)
- 1,047,576
- 128,000 (已佈建受控部署)
32,768 2024 年 5 月 31 日
gpt-4.1-nano (2025-04-14) - 文字和影像輸入
- 文字輸出
- 聊天完成 API
- 回應 API
- 串流
- 函式呼叫
結構化輸出 (聊天完成)
- 1,047,576
- 128,000 (已佈建受控部署)
32,768 2024 年 5 月 31 日
gpt-4.1-mini (2025-04-14) - 文字和影像輸入
- 文字輸出
- 聊天完成 API
- 回應 API
- 串流
- 函式呼叫
結構化輸出 (聊天完成)
- 1,047,576
- 128,000 (已佈建受控部署)
32,768 2024 年 5 月 31 日

模型路由器

智慧模型能從多種基礎聊天模型中選擇,以回應特定提示。

區域可用性

模型 區域
model-router (2025-05-19) 美國東部 2 (全球標準), 瑞典中部 (全球標準)

能力

型號識別碼 描述 內容視窗 輸出權杖數上限 定型資料 (最多)
model-router (2025-05-19) 智慧模型能從多種基礎聊天模型中選擇,以回應特定提示。 200,000* 32768 (GPT 4.1 系列)
100 K (o4-mini)
2024 年 5 月 31 日

*較大的內容視窗與 某些 基礎模型相容,這表示具有較大內容的 API 呼叫只有在提示剛好路由至正確的模型時才會成功,否則呼叫將會失敗。

computer-use-preview

為了搭配回應 API 電腦使用工具使用而訓練的實驗模型。 它可與第三方連結庫搭配使用,以允許模型控制滑鼠和鍵盤輸入,同時從目前環境的螢幕快照取得內容。

警告

我們不建議在生產環境中使用預覽模型。 我們將將預覽模型的所有部署升級至未來的預覽版本或最新的穩定 GA 版本。 指定預覽的模型不會遵循標準的 Azure OpenAI 模型生命週期。

可用性

需要註冊存取 computer-use-preview 權,並根據Microsoft的資格準則來授與存取權。 有權存取其他有限存取模型的客戶仍然需要要求此模型的存取權。

要求存取:computer-use-preview 有限存取模型應用程式

授與存取權之後,您必須建立模型的部署。

區域可用性

模型 區域
computer-use-preview 請參閱 模型數據表

能力

型號識別碼 描述 內容視窗 輸出權杖數上限 定型資料 (最多)
computer-use-preview (2025-03-11) 回應 API 電腦使用工具搭配使用的特製化模型

-工具
-串流
-Text(輸入/輸出)
- 影像(輸入)
8,192 1,024 2023 年 10 月

GPT-4.5 Preview

區域可用性

模型 區域
gpt-4.5-preview 請參閱 模型數據表

能力

型號識別碼 描述 內容視窗 輸出權杖數上限 定型資料 (最多)
gpt-4.5-preview (2025-02-27)
GPT-4.5 Preview
GPT 4.1 是建議取代此模型。 擅長處理各種文字和影像任務。
- 結構化輸出
- 提示快取
-工具
- 串流
- 文字(輸入/輸出)
- 影像(輸入)
128,000 16,384 2023 年 10 月

附註

模型無法回答自身相關問題是預期行為。 如果您想要知道模型定型數據的知識截止時機,或有關模型的其他詳細數據,您應該參考上述模型檔。

o 系列模型

Azure OpenAI o* 系列模型特別設計用來處理專注度和功能增加的推理和解決問題工作。 這些模型花費更多的時間處理和了解使用者的要求,這使得其在科學、程式碼撰寫和數學等領域比以前的迭代更加強大。

型號識別碼 描述 要求上限 (權杖) 定型資料 (最多)
codex-mini (2025-05-16) 微調 o4-mini 版本。
- 回應 API
- 結構化輸出
- 文字、影像處理
- 功能/工具
功能的完整摘要
輸入:200,000
輸出:100,000
2024 年 5 月 31 日
o3-pro (2025-06-10) - 回應 API
- 結構化輸出
- 文字、影像處理
- 功能/工具
功能的完整摘要
輸入:200,000
輸出:100,000
2024 年 5 月 31 日
o4-mini (2025-04-16) - 新的 推理模型,提供 增強的推理能力

- 聊天完成 API
- 回應 API
- 結構化輸出
- 文字、影像處理
- 功能/工具
功能的完整摘要
輸入:200,000
輸出:100,000
2024 年 5 月 31 日
o3 (2025-04-16) - 新的 推理模型,提供 增強的推理能力

- 聊天完成 API
- 回應 API
- 結構化輸出
- 文字、影像處理
- 函式/工具/平行工具呼叫
功能的完整摘要
輸入:200,000
輸出:100,000
2024 年 5 月 31 日
o3-mini (2025-01-31) - 增強的推理能力
- 結構化輸出
- 純文字處理
- 功能/工具
輸入:200,000
輸出:100,000
2023 年 10 月
o1 (2024-12-17) - 增強的推理能力
- 結構化輸出
- 文字、影像處理
- 功能/工具
輸入:200,000
輸出:100,000
2023 年 10 月
o1-preview (2024-09-12) 舊版預覽版本 輸入:128,000
輸出:32,768
2023 年 10 月
o1-mini (2024-09-12) o1 系列中較快速且更具成本效益的選項,適用於需要速度和較低資源耗用量的編碼工作。

預設提供全域標準部署。

標準 (地區) 部署目前僅適用於在有限存取版本中收到存取 o1-preview 權的選取客戶。
輸入:128,000
輸出:65,536
2023 年 10 月

可用性

若要深入瞭解進階 o-series 模型,請參閱 開始使用推理模型

區域可用性

模型 區域
codex-mini 美國東部 2 和瑞典中部 (全域標準)
o3-pro 美國東部 2 和瑞典中部 (全域標準)
o4-mini 請參閱 模型數據表
o3 請參閱 模型數據表
o3-mini 請參閱 模型數據表
o1 請參閱 模型數據表
o1-preview 請參閱 模型數據表。 此模型僅適用於在原始有限存取權中授與存取權的客戶
o1-mini 請參閱 模型數據表

GPT-4o 與 GPT-4 Turbo

GPT-4o 將文字和影像整合在單一模型中,使其能夠同時處理多個資料類型。 這種多模態方法可增強人類與電腦互動的精準度和回應性。 GPT-4o 在英語文字和編碼工作時會與 GPT-4 Turbo 進行比對,同時在非英文語言和視覺工作中提供卓越的效能,為 AI 能力樹立新的基準。

如何存取 GPT-4o 和 GPT-4o 迷你模型?

GPT-4o 和 GPT-4o 迷你適用於標準和全域標準模型部署。

您必須在可用的模型所支援的標準全域標準區域中建立或使用現有的資源。

建立資源時,您可以 部署 GPT-4o 模型。 如果您正在執行程式設計部署, 模型 名稱如下:

  • gpt-4o版本2024-11-20
  • gpt-4o版本2024-08-06
  • gpt-4o版本2024-05-13
  • gpt-4o-mini版本2024-07-18

GPT-4 Turbo

GPT-4 Turbo 是大型多模態模型 (接受文字或影像輸入並產生文字),可比 OpenAI 先前任何模型更精確地解決困難的問題。 與 GPT-3.5 Turbo 一樣,舊版 GPT-4 模型和 GPT-4 Turbo 已針對聊天進行最佳化,且適用於傳統的完成工作。

GPT-4

GPT-4 是 GPT-4 Turbo 的前身。 GPT-4 和 GPT-4 Turbo 模型都有 gpt-4 的基本模型名稱。 您可以檢查模型版本來區分 GPT-4 和 Turbo 模型。

  • gpt-4版本0314
  • gpt-4版本0613
  • gpt-4-32k版本0613

您可以在 模型摘要資料表中查看每個模型支援的令牌內容長度。

GPT-4 和 GPT-4 Turbo 模型

  • 這些模型只能與聊天完成 API 搭配使用。

請參閱 模型版本 ,以瞭解 Azure OpenAI 如何處理模型版本升級,以及 使用模型 來瞭解如何檢視及設定 GPT-4 部署的模型版本設定。

型號識別碼 描述 要求上限 (權杖) 定型資料 (最多)
gpt-4o (2024-11-20)
GPT-4o (Omni)
最新的大型 GA 模型
- 結構化輸出
- 文字、影像處理
- JSON 模式
- 平行函式呼叫
- 增強精確度和回應性
- 與具備視覺功能的 GPT-4 Turbo 在英語文字和編碼工作上的同等水平
- 在非英文語言和視覺工作中具有優越的效能。
- 增強創意寫作能力
輸入:128,000
輸出:16,384
2023 年 10 月
gpt-4o (2024-08-06)
GPT-4o (Omni)
- 結構化輸出
- 文字、影像處理
- JSON 模式
- 平行函式呼叫
- 增強精確度和回應性
- 與具備視覺功能的 GPT-4 Turbo 在英語文字和編碼工作上的同等水平
- 在非英文語言和視覺工作中具有優越的效能
輸入:128,000
輸出:16,384
2023 年 10 月
gpt-4o-mini (2024-07-18)
GPT-4o mini
最新的小型 GA 模型
- 快速、便宜、能夠取代 GPT-3.5 Turbo 系列模型的理想模型。
- 文字、影像處理
- JSON 模式
- 平行函式呼叫
輸入:128,000
輸出:16,384
2023 年 10 月
gpt-4o (2024-05-13)
GPT-4o (Omni)
文字、影像處理
- JSON 模式
- 平行函式呼叫
- 增強精確度和回應性
- 與具備視覺功能的 GPT-4 Turbo 在英語文字和編碼工作上的同等水平
- 在非英文語言和視覺工作中具有優越的效能
輸入:128,000
輸出:4,096
2023 年 10 月
gpt-4 (turbo-2024-04-09)
包含視覺功能的 GPT-4 Turbo
新的 GA 模型
- 取代所有先前的 GPT-4 預覽模型 (vision-preview1106-Preview0125-Preview)。
- 功能可用性 目前會根據輸入方法和部署類型而有所不同。
輸入:128,000
輸出:4,096
2023 年 12 月
gpt-4-32k (0613) 舊版 GA 模型
- 使用工具呼叫基本函式
32,768 2021 年 9 月
gpt-4 (0613) 舊版 GA 模型
- 使用工具呼叫基本函式
8,192 2021 年 9 月
gpt-4-32k(0314) 舊版 GA 模型
- 退休資訊
32,768 2021 年 9 月
gpt-4 (0314) 舊版 GA 模型
- 退休資訊
8,192 2021 年 9 月

警告

我們不建議在生產環境中使用預覽模型。 我們將將預覽模型的所有部署升級至未來的預覽版本或最新的穩定 GA 版本。 指定預覽的模型不會遵循標準的 Azure OpenAI 模型生命週期。

GPT-3.5

GPT-3.5 模型可以了解並產生自然語言或程式碼。 GPT-3.5 系列中功能最強大且符合成本效益的模型是 GPT-3.5 Turbo,已針對聊天進行最佳化,也適用於傳統的完成工作。 GPT-3.5 Turbo 可與聊天完成 API 搭配使用。 GPT-3.5 Turbo Instruct 具有與使用完成 API 而非聊天完成 API 類似的功能 text-davinci-003。 我們建議使用 GPT-3.5 Turbo 和 GPT-3.5 Turbo Instruct,而不是舊版 GPT-3.5 和 GPT-3 模型。

型號識別碼 描述 要求上限 (權杖) 定型資料 (最多)
gpt-35-turbo (0125) 新增 最新的 GA 模型
- JSON 模式
- 平行函式呼叫
- 可重現的輸出 (預覽)
- 以要求格式回應時具有更高的精確度。
- 修正造成非英文語言函式呼叫文字編碼問題的 Bug。
輸入:16,385
輸出:4,096
2021 年 9 月
gpt-35-turbo (1106) 舊版 GA 模型
- JSON 模式
- 平行函式呼叫
- 可重現的輸出 (預覽)
輸入:16,385
輸出:4,096
2021 年 9 月
gpt-35-turbo-instruct (0914) 僅完成端點
- 取代傳統完成模型
4,097 2021 年 9 月

若要深入瞭解如何與 GPT-3.5 Turbo 和聊天完成 API 互動,請參閱我們的 深入作說明

1 此模型將接受要求 > 4,096 個令牌。 不建議超過 4,096 個輸入權杖限制,因為較新版本的模型上限為 4,096 個權杖。 如果使用此模型超過 4,096 個輸入權杖時遇到問題,則官方不支援此設定。

內嵌

text-embedding-3-large 是最新且功能最強的內嵌模型。 無法在內嵌模型之間進行升級。 若要從使用 text-embedding-ada-002 移轉至 text-embedding-3-large,您必須產生新的內嵌。

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

在測試中,OpenAI 會報告大型和小型第三代內嵌模型,透過 MIRACL 基準提供更佳的平均多語言擷取效能,同時仍使用 MTEB 基準維持英文工作的效能。

評估基準 text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
MIRACL 平均值 31.4 44.0 54.9
MTEB 平均值 61.0 62.3 64.6

第三代內嵌模型支援透過新的 dimensions 參數減少內嵌的大小。 一般而言,從計算、記憶體和儲存體的觀點來看,較大的內嵌成本會更高。 調整維度數目的功能可讓您更充分掌控整體成本和效能。 OpenAI 1.x Python 程式庫的所有版本都不支援 dimensions 參數,若要利用此參數,建議您升級至最新版本:pip install openai --upgrade

OpenAI 的 MTEB 基準測試發現,即使第三代模型的維度減少到小於 text-embeddings-ada-002 1,536 個維度,效能還是稍微好一些。

影像產生模型

影像產生模型會從使用者提供的文字提示產生影像。 GPT-image-1 目前為有限存取權公開預覽。 DALL-E 3 通常可搭配 REST API 使用。 包含用戶端 SDK 的 DALL-E 2 和 DALL-E 3 處於預覽狀態。

可用性

需要註冊存取 gpt-image-1 權,並根據Microsoft的資格準則來授與存取權。 有權存取其他有限存取模型的客戶仍然需要要求此模型的存取權。

要求存取:gpt-image-1 有限存取模型應用程式

授與存取權之後,您必須建立模型的部署。

區域可用性

模型 區域
dall-e-3 美國東部
澳大利亞東部
瑞典中部
gpt-image-1 美國西部 3 (全域標準)
阿聯酋北部(全球標準)

影片產生模型

Sora 是OpenAI的AI模型,可從文字指示建立真實且富有想像力的視訊場景。 Sora 目前為公開預覽。

區域可用性

模型 區域
sora 美國東部 2

音訊模型

Azure OpenAI 中的音訊模型可透過 realtimecompletionsaudio API 取得。

GPT-4o 語音模型

GPT 4o 音訊模型是 GPT-4o 模型系列的一部分,並支援低延遲、「語音輸入、語音輸出」交談互動或音訊產生。

警告

我們不建議在生產環境中使用預覽模型。 我們將將預覽模型的所有部署升級至未來的預覽版本或最新的穩定 GA 版本。 指定預覽的模型不會遵循標準的 Azure OpenAI 模型生命週期。

下表提供有關最大請求令牌和訓練數據的詳細資料。

型號識別碼 描述 要求上限 (權杖) 定型資料 (最多)
gpt-4o-mini-audio-preview (2024-12-17)
GPT-4o 音訊
音訊模型用於生成音訊和文字。 輸入:128,000
輸出:4,096
2023 年 10 月
gpt-4o-mini-realtime-preview (2024-12-17)
GPT-4o 音訊
用於即時音訊處理的音訊模型 輸入:128,000
輸出:4,096
2023 年 10 月
gpt-4o-audio-preview (2024-12-17)
GPT-4o 音訊
音訊模型用於生成音訊和文字。 輸入:128,000
輸出:4,096
2023 年 10 月
gpt-4o-realtime-preview (2024-12-17)
GPT-4o 音訊
用於即時音訊處理的音訊模型 輸入:128,000
輸出:4,096
2023 年 10 月
gpt-4o-mini-realtime-preview (2024-12-17)
GPT-4o 音訊
用於即時音訊處理的音訊模型 輸入:128,000
輸出:4,096
2023 年 10 月

若要比較所有區域中 GPT-4o 音訊模型的可用性,請參閱 models 數據表

音訊應用程式介面

透過 API 的 /audio 音訊模型可用於語音轉換文字、翻譯和文字到語音轉換。

語音轉換文字模型

型號識別碼 描述 要求上限 (音訊檔案大小)
whisper 一般用途語音辨識模型。 25 MB
gpt-4o-transcribe 由 GPT-4o 提供的語音轉換文字。 25 MB
gpt-4o-mini-transcribe 由 GPT-4o mini 驅動的語音轉文字系統。 25 MB

語音翻譯模型

型號識別碼 描述 要求上限 (音訊檔案大小)
whisper 一般用途語音辨識模型。 25 MB

文字轉換語音模型 (預覽版)

型號識別碼 描述
tts 針對速度優化的文字到語音轉換。
tts-hd 經過品質優化的文字轉語音技術。
gpt-4o-mini-tts 由 GPT-4o mini 提供的文字到語音轉換模型。

您可以引導語音選擇特定的風格或語調來說話。

如需詳細資訊,請參閱本文中的 音訊模型區域可用性

模型摘要資料表和區域可用性

依部署類型排序的模型

Azure OpenAI 可讓客戶選擇符合其商務和使用模式的裝載結構。 此服務提供兩種主要部署類型:

  • 標準 提供全域部署選項,以全域路由傳送流量以提供更高的輸送量。
  • 佈建也提供全域部署選項,讓客戶可在 Azure 全域基礎結構之間購買和部署佈建的輸送量單位。

所有部署都可以執行完全相同的推斷作業,但計費、規模和效能大不相同。 若要深入瞭解 Azure OpenAI 部署類型,請參閱我們的 部署類型指南

全域標準模型可用性

地區 o32025-04-16 o4-mini2025-04-16 gpt-image-12025-04-15 gpt-4.12025-04-14 gpt-4.1-nano2025-04-14 gpt-4.1-mini2025-04-14 電腦使用預覽2025-03-11 gpt-4.5-preview2025-02-27 o3-mini2025-01-31 o12024-12-17 o1-preview2024-09-12 o1-mini2024-09-12 gpt-4o2024-05-13 gpt-4o2024-08-06 gpt-4o2024-11-20 gpt-4o-mini2024-07-18 gpt-4turbo-2024-04-09 text-embedding-3-small1 text-embedding-3-large1 text-embedding-ada-0022 gpt-4o-realtime-preview2024-12-17 gpt-4o-audio-preview2024-12-17 gpt-4o-mini-realtime-preview2024-12-17 gpt-4o-mini-audio-preview2024-12-17 gpt-4o-transcribe2025-03-20 gpt-4o-mini-tts2025-03-20 gpt-4o-mini-transcribe2025-03-20
australiaeast - - - - - - - - - - - - - - - - -
brazilsouth(巴西南部) - - - - - - - - - - - - - - - - -
canadaeast - - - - - - - - - - - - - - - -
eastus - - - - - - - - - - - - - -
eastus2 -
francecentral - - - - - - - - - - - - - - - - -
德國西中部 - - - - - - - - - - - - - - - -
italynorth - - - - - - - - - - - - - - - - - - - -
日本東方 - - - - - - - - - - - - - - - -
koreacentral - - - - - - - - - - - - - - - -
northcentralus - - - - - - - - - - - - - -
norwayeast - - - - - - - - - - - - - - - - -
波蘭中心 - - - - - - - - - - - - - - - -
southafricanorth - - - - - - - - - - - - - - - - -
southcentralus - - - - - - - - - - - - - -
南印度 - - - - - - - - - - - - - - - -
spaincentral - - - - - - - - - - - - - - - -
瑞典central - - -
switzerlandnorth - - - - - - - - - - - - - - - -
uaenorth - - - - - - - - - - - - - - - -
uksouth - - - - - - - - - - - - - - - -
westeurope - - - - - - - - - - - - - - - - -
維斯特斯 - - - - - - - - - - - - - - -
westus3 - - - - - - - - - - - - -

附註

o1-mini 目前適用於所有客戶進行全域標準部署。

精選客戶已被授與對 o1-mini 的標準 (區域) 部署存取權,作為 o1-preview 有限存取版本的一部分。 目前,對 o1-mini 標準(區域)部署的存取尚未擴大。

下表不包含微調區域可用性資訊。 如需這項資訊,請參閱微調區段

依端點的標準部署(區域)模型

聊天完成

地區 o1-preview2024-09-12 o1-mini2024-09-12 gpt-4o2024-05-13 gpt-4o2024-08-06 gpt-4o2024-11-20 gpt-4o-mini2024-07-18 gpt-40613 gpt-4turbo-2024-04-09 gpt-4-32k0613 gpt-35-turbo1106 gpt-35-turbo0125 gpt-35-turbo-16k0613
australiaeast - - - - - -
canadaeast - - - - - -
eastus - -
eastus2 - -
francecentral - - - - - -
日本東方 - - - - - - - - -
northcentralus - -
norwayeast - - - - - - - - - - -
southcentralus - - - -
南印度 - - - - - - - - -
瑞典central
switzerlandnorth - - - - - - -
uksouth - - - - - - - -
westeurope - - - - - - - - - - -
維斯特斯 - - -
westus3 - - - -

附註

o1-mini 目前適用於所有客戶進行全域標準部署。

精選客戶已被授與對 o1-mini 的標準 (區域) 部署存取權,作為 o1-preview 有限存取版本的一部分。 目前,對 o1-mini 標準(區域)部署的存取尚未擴大。

GPT-4 和 GPT-4 Turbo 模型可用性

選擇客戶存取權

除了上述可供所有 Azure OpenAI 客戶使用的區域之外,有些特定的既有客戶已被授予存取其他區域中 GPT-4 版本的權限。

模型 區域
gpt-4 (0314)
gpt-4-32k (0314)
美國東部
法國中部
美國中南部
英國南部
gpt-4 (0613)
gpt-4-32k (0613)
美國東部
美國東部 2
日本東部
英國南部

GPT-3.5 模型

請參閱 模型版本 ,以瞭解 Azure OpenAI 如何處理模型版本升級,以及 使用模型 來瞭解如何檢視及設定 GPT-3.5 Turbo 部署的模型版本設定。

微調模型

附註

gpt-35-turbo - 此模型的微調僅限於某些區域,而不是在所有提供基礎模型的區域內都可用。

如果您在 Azure AI Foundry 專案中使用 Azure OpenAI 模型,而不是在專案外部使用 Azure OpenAI 模型,微調支援的區域可能會有所不同。

型號識別碼 標準訓練區域 全球訓練 (預覽) 要求上限 (權杖) 定型資料 (最多) 特徵
gpt-35-turbo (1106) 美國東部 2
美國中北部
瑞典中部
瑞士西部
- 輸入:16,385
輸出:4,096
2021 年 9 月 文字轉換文字
gpt-35-turbo (0125) 美國東部 2
美國中北部
瑞典中部
瑞士西部
- 16,385 2021 年 9 月 文字轉換文字
gpt-4o-mini (2024-07-18) 美國中北部
瑞典中部
- 輸入:128,000
輸出:16,384
訓練範例內容長度:65,536
2023 年 10 月 文字轉換文字
gpt-4o (2024-08-06) 美國東部 2
美國中北部
瑞典中部
- 輸入:128,000
輸出:16,384
訓練範例內容長度:65,536
2023 年 10 月 文字與視覺轉換文字
gpt-4.1 (2025-04-14) 美國中北部
瑞典中部
輸入:128,000
輸出:16,384
訓練範例內容長度:65,536
2024 年 5 月 文字與視覺轉換文字
gpt-4.1-mini (2025-04-14) 美國中北部
瑞典中部
輸入:128,000
輸出:16,384
訓練範例內容長度:65,536
2024 年 5 月 文字轉換文字
gpt-4.1-nano (2025-04-14) 美國中北部
瑞典中部
- 輸入:128,000
輸出:16,384
訓練範例上下文長度:32,768
2024 年 5 月 文字轉換文字
o4-mini (2025-04-16) 美國東部 2
瑞典中部
- 輸入:128,000
輸出:16,384
訓練範例內容長度:65,536
2024 年 5 月 文字轉換文字

附註

全域訓練 (公開預覽) 針對每個權杖提供更實惠的訓練,但是不提供資料落地。 它目前可供下列區域中的 Azure OpenAI 資源使用,即將推出更多區域:

  • 澳大利亞東部
  • 巴西南部
  • 美國東部
  • 美國東部 2
  • 法國中部
  • 德國中西部
  • 義大利北部
  • 日本東部 (沒有視覺支援)
  • 韓國中部
  • 美國中北部
  • 挪威東部
  • 波蘭中部
  • 東南亞
  • 南非北部
  • 西班牙中部
  • 瑞典中部
  • 瑞士西部
  • 瑞士北部
  • 英國南部
  • 美國西部
  • 美國西部 3

助理 (預覽版)

要具備助理功能,您需要的是支援的模型和支援的區域的組合。 某些工具和功能需要最新的模型。 助理 API、SDK 和 Azure AI Foundry 中提供下列模型。 下表適用於標準部署。 如需布建輸送量單位 (PTU) 可用性的相關信息,請參閱 布建的輸送量。 列出的模型和區域可以與 Assistants v1 和 v2 搭配使用。 如果下列區域支援 全域標準模型 ,您可以使用這些模型。

地區 gpt-4o2024-05-13 gpt-4o2024-08-06 gpt-4o-mini2024-07-18 gpt-40613 gpt-41106-Preview gpt-40125-Preview gpt-4turbo-2024-04-09 gpt-4-32k0613 gpt-35-turbo0613 gpt-35-turbo1106 gpt-35-turbo0125 gpt-35-turbo-16k0613
australiaeast - - - - -
eastus - - - -
eastus2 - - - -
francecentral - - - - - -
日本東方 - - - - - - - - -
norwayeast - - - - - - - - - - -
南印度 - - - - - - - - -
瑞典central - -
uksouth - - - - - -
維斯特斯 - - - - -
westus3 - - - - - -

模型淘汰

如需模型淘汰的最新資訊,請參閱 模型淘汰指南

下一步