Azure OpenAI 服務模型

Azure OpenAI 服務是由一組具有不同功能和價格點的各種模型提供。 模型供應情形因區域而異 如需 2024 年 7 月淘汰的 GPT-3 和其他模型相關資訊,請參閱 Azure OpenAI 服務舊模型

模型 描述
GPT-4 Turbo 🆕 具有多模式版本的最新支援 Azure OpenAI 模型,可接受文字和影像作為輸入。
GPT-4 一組在 GPT-3.5 上獲得改善的模型,可以了解及產生自然語言和程式碼。
GPT-3.5 一組在 GPT-3 上獲得改善的模型,可以了解及產生自然語言和程式碼。
內嵌 一組可將文字轉換成數值向量形式,以輔助文字相似性的模型。
DALL-E 一系列可從自然語言產生原始影像的模型。
耳語 預覽版中的一系列模型,可將語音轉譯和翻譯為文字。
文字轉換語音 (預覽版) 預覽版中的一系列模型,可以合成文字轉換語音。

GPT-4 Turbo

GPT-4 Turbo 是大型多模式模型(接受文字或影像輸入併產生文字),可解決比 OpenAI 先前任何模型更精確的困難問題。 與 GPT-3.5 Turbo 和較舊的 GPT-4 模型 GPT-4 Turbo 一樣,已針對聊天進行優化,並適用於傳統完成工作。

GPT-4 Turbo 的最新 GA 版本為:

  • gpt-4版本:turbo-2024-04-09

這是下列預覽模型的取代專案:

  • gpt-4版本:1106-Preview
  • gpt-4版本:0125-Preview
  • gpt-4版本:vision-preview

OpenAI 與 Azure OpenAI GPT-4 Turbo GA 模型之間的差異

  • OpenAI 的最新 0409 渦輪增壓模型版本支援所有推斷要求的 JSON 模式和函式呼叫。
  • Azure OpenAI 的最新版本 turbo-2024-04-09 目前不支援使用 JSON 模式和函式呼叫,以影像(視覺)輸入提出推斷要求。 以文字為基礎的輸入要求(沒有 image_url 和內嵌影像的要求)支援 JSON 模式和函式呼叫。

gpt-4 視覺預覽的差異

  • 版本不支援 gpt-4turbo-2024-04-09Azure AI 特定視覺增強功能與 GPT-4 Turbo with Vision 整合。 這包括光學字元辨識 (OCR)、物件地面、視訊提示,以及使用影像改善數據的處理。

GPT-4 Turbo 布建的受控可用性

  • gpt-4版本:turbo-2024-04-09 適用於標準和布建的部署。 此模型的 布建版本目前不支援影像/視覺推斷要求。 此模型的布建部署只接受文字輸入。 標準模型部署同時接受文字和影像/視覺推斷要求。

區域可用性

如需模型區域可用性的資訊,請參閱標準與布建部署的模型矩陣

使用視覺 GA 部署 GPT-4 Turbo

若要從 Studio UI 部署 GA 模型,請從下拉功能表中選取 GPT-4 並選擇 turbo-2024-04-09 版本。 模型的預設配額 gpt-4-turbo-2024-04-09 會與 GPT-4-Turbo 目前的配額相同。 請參閱區域配額限制。

GPT-4

GPT-4 是 GPT-4 Turbo 的前身。 GPT-4 和 GPT-4 Turbo 模型都有 的基本模型名稱 gpt-4。 您可以檢查模型版本來區分 GPT-4 和 Turbo 模型。

  • gpt-4版本0314
  • gpt-4版本0613
  • gpt-4-32k版本0613

您可以在模型摘要資料表中看到每個模型所支援的權杖內容長度。

GPT-4 和 GPT-4 Turbo 模型

  • 這些模型只能與聊天完成 API 搭配使用。

請參閱模型版本,了解 Azure OpenAI 服務如何處理模型版本升級,以及使用模型了解如何檢視和設定 GPT-4 部署的模型版本設定。

Model ID 要求上限 (權杖) 訓練資料 (上限)
gpt-4 (0314) 8,192 2021 年 9 月
gpt-4-32k(0314) 32,768 2021 年 9 月
gpt-4 (0613) 8,192 2021 年 9 月
gpt-4-32k (0613) 32,768 2021 年 9 月
gpt-4 (1106-Preview)1
GPT-4 Turbo 預覽版
輸入:128,000
輸出:4,096
2023 年 4 月
gpt-4 (0125-Preview)1
GPT-4 Turbo 預覽版
輸入:128,000
輸出:4,096
2023 年 12 月
gpt-4 (vision-preview)2
包含視覺功能的 GPT-4 Turbo 預覽版
輸入:128,000
輸出:4,096
2023 年 4 月
gpt-4 (turbo-2024-04-09) 🆕
GPT-4 Turbo with Vision GA
輸入:128,000
輸出:4,096
2023 年 12 月

1 GPT-4 Turbo Preview = gpt-4 (0125-Preview) 或 gpt-4 (1106-Preview)。 若要部署此模型,請在 [部署] 底下,選取模型 [gpt-4]。 在版本下選取 [0125-Preview] 或 [1106-Preview]。

2 包含視覺功能的 GPT-4 Turbo 預覽版 = gpt-4 (vision-preview)。 若要部署此模型,請在 [部署] 底下,選取模型 [gpt-4]。 對於 [模型版本],請選取 [vision-preview]。

警告

我們不建議在生產環境中使用預覽模型。 我們會將預覽模型的所有部署升級至未來的預覽版本和穩定版本。 指定的模型預覽版不遵循標準的 Azure OpenAI 模型生命週期。

注意

gpt-4gpt-4-32k 的版本 0314 將在 2024 年 7 月 5 日或之後淘汰。 gpt-4gpt-4-32k 的版本 0613 將在 2024 年 9 月 30 日或之後淘汰。 如需了解模型升級行為,請參閱模型更新

  • GPT-4 版本 0125-preview 是先前發行為 1106-preview 版 GPT-4 Turbo 預覽版的更新版本。
  • 與 gpt-4-1106-preview 相比,GPT-4 版本 0125-preview 更完整地完成程式碼產生等工作。 因此,根據工作的不同,客戶可能會發現 GPT-4-0125-preview 比 gpt-4-1106-preview 產生更多的輸出。 我們建議客戶比較新模型的輸出。 GPT-4-0125-preview 也會解決 gpt-4-1106-preview 中針對非英文語言的 UTF-8 處理中的錯誤 (bug)。 GPT-4 版本 turbo-2024-04-09 是最新的 GA 版本,並取代 0125-Preview1106-previewvision-preview

重要

  • gpt-4 版本 1106-Preview 和 0125-Preview 將會在未來使用穩定版本的 gpt-4 升級。 gpt-4版本 1106-Preview 和 0125-Preview 的部署會設定為「預設自動更新」,而「過期時升級」將會在穩定版本發行后開始升級。 針對每個部署,模型版本升級會在服務中不中斷 API 呼叫。 升級會依區域暫存,且完整升級程式預期需要 2 周的時間。 gpt-4版本 1106-Preview 和 0125-Preview 的部署不會升級為「無自動升級」,且會在區域中升級預覽版本時停止運作。 如需升級時間的詳細資訊,請參閱 Azure OpenAI 模型淘汰和淘汰

GPT-3.5

GPT-3.5 模型可以了解並產生自然語言或程式碼。 GPT-3.5 系列中功能最強大且符合成本效益的模型是 GPT-3.5 Turbo,已針對聊天進行最佳化,也適用於傳統的完成工作。 GPT-3.5 Turbo 可與聊天完成 API 搭配使用。 GPT-3.5 Turbo Instruct 具有與使用完成 API 而非聊天完成 API 類似的功能 text-davinci-003。 我們建議使用 GPT-3.5 Turbo 和 GPT-3.5 Turbo Instruct,而不是舊版 GPT-3.5 和 GPT-3 模型

  • gpt-35-turbo
  • gpt-35-turbo-16k
  • gpt-35-turbo-instruct

您可以在模型摘要資料表中看到每個模型所支援的權杖內容長度。

若要深入了解如何與 GPT-3.5 Turbo 和聊天完成 API 進行互動,請參閱我們的深入操作說明

Embeddings

text-embedding-3-large 是最新且功能最強的內嵌模型。 無法在內嵌模型之間進行升級。 若要從使用 text-embedding-ada-002 移轉至 text-embedding-3-large,您必須產生新的內嵌。

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

在測試中,OpenAI 報告顯示大型和小型第三代內嵌模型在 MIRACL 基準中提供了更好的平均多語言擷取效能,同時仍在 MTEB 基準中保持了英文工作的效能。

評估基準 text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
MIRACL 平均值 31.4 44.0 54.9
MTEB 平均值 61.0 62.3 64.6

第三代內嵌模型支援透過新的 dimensions 參數減少內嵌的大小。 一般而言,從計算、記憶體和儲存體的觀點來看,較大的內嵌成本會更高。 調整維度數目的功能可讓您更充分掌控整體成本和效能。 OpenAI 1.x Python 程式庫的所有版本都不支援 dimensions 參數,若要利用此參數,建議您升級至最新版本:pip install openai --upgrade

OpenAI 的 MTEB 基準測試發現,即使第三代模型的維度減少到小於 text-embeddings-ada-002 1,536 個維度,效能還是稍微好一些。

DALL-E

DALL-E 模型會從使用者提供的文字提示產生影像。 DALL-E 3 通常可用於 REST API。 具有用戶端 SDK 的 DALL-E 2 和 DALL-E 3 處於預覽狀態。

耳語

Whisper 模型可用於語音轉換文字。

您還可以透過 Azure AI 語音批次轉譯 API 使用 Whisper 模型。 請參閱什麼是 Whisper 模型?深入了解何時使用 Azure AI 語音與Azure OpenAI 服務。

文字轉換語音 (預覽版)

OpenAI 文字轉換語音模型 (目前為預覽版) 可用於合成文字轉換語音。

您也可以透過 Azure AI 語音使用 OpenAI 文字轉換語音聲音。 若要深入了解,請參閱透過 Azure OpenAI 服務或透過 Azure AI 語音實現 OpenAI 文字轉換語音聲音指南。

模型摘要資料表和區域可用性

注意

本文主要涵蓋適用於所有具有標準部署類型之 Azure OpenAI 客戶的模型/區域可用性。 某些選取的客戶可以存取下列統一數據表中未列出的模型/區域組合。 如需布建部署的詳細資訊,請參閱我們的 布建指引

標準部署模型可用性

區域 gpt-40613 gpt-4,1106-Preview gpt-40125-Preview gpt-4vision-preview gpt-4turbo-2024-04-09 gpt-4-32k0613 gpt-35-turbo0301 gpt-35-turbo0613 gpt-35-turbo1106 gpt-35-turbo0125 gpt-35-turbo-16k0613 gpt-35-turbo-instruct0914 text-embedding-ada-0021 text-embedding-ada-002, 2 text-embedding-3-small1 text-embedding-3-large1 babbage-0021 dall-e-3, 3.0 davinci-0021 tts,001 tts-hd001 低聲001
australiaeast - - - - - - - - - - - - -
brazilsouth - - - - - - - - - - - - - - - - - - - - -
canadaeast - - - - - - - - - - - -
eastus - - - - - - - - - - - -
eastus2 - - - - - - - - - - - - - -
francecentral - - - - - - - - - - - - - -
japaneast - - - - - - - - - - - - - - - - - -
northcentralus - - - - - - - - - - - -
norwayeast - - - - - - - - - - - - - - - - - - -
southafricanorth - - - - - - - - - - - - - - - - - - - - -
southcentralus - - - - - - - - - - - - - - - - -
southindia - - - - - - - - - - - - - - - - - -
swedencentral - - - - - -
switzerlandnorth - - - - - - - - - - - - - - - -
uksouth - - - - - - - - - - - - - - -
westeurope - - - - - - - - - - - - - - - - - - -
westus - - - - - - - - - - - - - - - - - -
westus3 - - - - - - - - - - - - - - - - - - - -

下表不包含微調區域可用性,如需這項資訊,請參閱專用 的微調區段

標準部署模型配額

模型的預設配額會因模型和區域而異。 默認配額限制可能會變更。

標準部署的配額會以 每分鐘令牌(TPM)來說明。

區域 GPT-4 GPT-4-32K GPT-4-Turbo GPT-4-Turbo-V GPT-35-Turbo GPT-35-Turbo-指示 Text-Embedding-Ada-002 text-embedding-3-small text-embedding-3-large Babbage-002 Babbage-002 - finetune Davinci-002 達文奇-002 - 微調 GPT-35-Turbo - 微調 GPT-35-Turbo-1106 - 微調 GPT-35-Turbo-0125 - 微調
australiaeast 40 K 80 K 80 K 30 K 300 K - 350 K - - - - - - - - -
brazilsouth - - - - - - 350 K - - - - - - - - -
canadaeast 40 K 80 K 80 K - 300 K - 350 K 350 K 350 K - - - - - - -
eastus - - 80 K - 240 K 240 K 240 K 350 K 350 K - - - - - - -
eastus2 - - 80 K - 300 K - 350 K 350 K 350 K - - - - 250 K 250 K 250 K
francecentral 20 K 60 K 80 K - 240 K - 240 K - - - - - - - - -
japaneast - - - 30 K 300 K - 350 K - - - - - - - - -
northcentralus - - 80 K - 300 K - 350 K - - 240 K 250 K 240 K 250 K 250 K 250 K 250 K
norwayeast - - 150 K - - - 350 K - - - - - - - - -
southafricanorth - - - - - - 350 K - - - - - - - - -
southcentralus - - 80 K - 240 K - 240 K - - - - - - - - -
southindia - - 150 K - 300 K - 350 K - - - - - - - - -
swedencentral 40 K 80 K 150 K 30 K 300 K 240 K 350 K - - 240 K 250 K 240 K 250 K 250 K 250 K 250 K
switzerlandnorth 40 K 80 K - 30 K 300 K - 350 K - - - - - - - - -
switzerlandwest - - - - - - - - - - 250 K - 250 K 250 K 250 K 250 K
uksouth - - 80 K - 240 K - 350 K - - - - - - - - -
westeurope - - - - 240 K - 240 K - - - - - - - - -
westus - - 80 K 30 K 300 K - 350 K - - - - - - - - -
westus3 - - 80 K - - - 350 K - - - - - - - - -

1 K = 每分鐘 1000 個令牌(TPM)。 TPM 與每分鐘要求 (RPM) 之間的關聯性目前定義為每 1000 TPM 6 RPM。

已布建的部署模型可用性

區域 gpt-40613 gpt-4,1106-Preview gpt-40125-Preview gpt-4turbo-2024-04-09 gpt-4-32k0613 gpt-35-turbo1106 gpt-35-turbo0125
australiaeast -
brazilsouth - - -
canadacentral - - - -
canadaeast - - - -
eastus -
eastus2 -
francecentral - -
germanywestcentral - -
japaneast - - - -
koreacentral - - - -
northcentralus -
norwayeast - - - -
波蘭central -
southafricanorth - - -
southcentralus -
southindia -
swedencentral -
switzerlandnorth -
switzerlandwest - - - - - -
uksouth -
westus -
westus3

注意

布建 gpt-4的版本:turbo-2024-04-09 目前僅限於文字。

如何? 取得已布建的存取權?

您必須與您的 Microsoft 銷售/帳戶小組交談,以取得布建的輸送量。 如果您沒有銷售/帳戶小組,不幸的是,目前您無法購買布建的輸送量。

如需布建部署的詳細資訊,請參閱我們的 布建指引

GPT-4 和 GPT-4 Turbo 模型可用性

公用雲端區域

區域 gpt-40613 gpt-4,1106-Preview gpt-40125-Preview gpt-4vision-preview gpt-4turbo-2024-04-09 gpt-4-32k0613
australiaeast - -
canadaeast - - -
eastus - - - - -
eastus2 - - - -
francecentral - - -
japaneast - - - - -
northcentralus - - - - -
norwayeast - - - - -
southcentralus - - - - -
southindia - - - - -
swedencentral -
switzerlandnorth - - -
uksouth - - - -
westus - - - -
westus3 - - - - -

選取客戶存取權

除了上述可供所有 Azure OpenAI 客戶使用的區域之外,某些選取的現有客戶已獲授與其他區域中 GPT-4 版本的存取權:

模型 區域
gpt-4 (0314) 美國東部
法國中部
美國中南部
英國南部
gpt-4 (0613) 美國東部
美國東部 2
日本東部
英國南部

Azure Government 區域

Azure Government 提供下列 GPT-4 模型:

Model ID 模型可用性
gpt-4 (1106-Preview) US Gov 維吉尼亞州
US Gov 亞利桑那州

GPT-3.5 模型

重要

新的 gpt-35-turbo (0125) 模型進行了各種改善,包括提高以要求格式回應的精確度,以及修正導致非英文語言函式呼叫的文字編碼問題的錯誤 (bug)。

GPT-3.5 Turbo 與 Chat Completion API 搭配使用。 GPT-3.5 Turbo 0301 版也可以與完成 API 搭配使用,但不建議這麼做。 GPT-3.5 Turbo 版本 0613 和 1106 僅支援聊天完成 API。

GPT-3.5 Turbo 版本 0301 是該模型發行的第一個版本。 版本 0613 是模型的第二個版本,並新增了函式呼叫支援。

請參閱模型版本,了解 Azure OpenAI 服務如何處理模型版本升級,以及使用模型了解如何檢視和設定 GPT-3.5 Turbo 部署的模型版本設定。

注意

gpt-35-turbogpt-35-turbo-16k 的版本0613不會早於 2024 年 8 月 1 日淘汰。 gpt-35-turbo的版本0301不會早於 2024 年 8 月 1 日淘汰。 如需了解模型升級行為,請參閱模型更新

Model ID 要求上限 (權杖) 訓練資料 (上限)
gpt-35-turbo1 (0301) 4,096 2021 年 9 月
gpt-35-turbo (0613) 4,096 2021 年 9 月
gpt-35-turbo-16k (0613) 16,384 2021 年 9 月
gpt-35-turbo-instruct (0914) 4,097 2021 年 9 月
gpt-35-turbo (1106) 輸入:16,385
輸出:4,096
2021 年 9 月
gpt-35-turbo (0125) 新增 輸入:16,385
輸出:4,096
2021 年 9 月

GPT-3.5-Turbo 模型可用性

公用雲端區域

區域 gpt-35-turbo0301 gpt-35-turbo0613 gpt-35-turbo1106 gpt-35-turbo0125 gpt-35-turbo-16k0613 gpt-35-turbo-instruct0914
australiaeast - - -
canadaeast - -
eastus - -
eastus2 - - - -
francecentral - -
japaneast - - - -
northcentralus - - -
southcentralus - - - -
southindia - - - - -
swedencentral - -
switzerlandnorth - - - -
uksouth - -
westeurope - - - - -
westus - - - - -

1 此模型將接受 > 4,096 個權杖要求。 不建議超過 4,096 個輸入權杖限制,因為較新版本的模型上限為 4,096 個權杖。 如果使用此模型超過 4,096 個輸入權杖時遇到問題,則官方不支援此設定。

Azure Government 區域

Azure Government 提供下列 GPT-3.5 渦輪增壓模型:

Model ID 模型可用性
gpt-35-turbo (1106-Preview) US Gov 維吉尼亞州

內嵌模型

這些模型只能與內嵌 API 要求搭配使用。

注意

text-embedding-3-large 是最新且功能最強的內嵌模型。 無法在內嵌模型之間進行升級。 若要從使用 text-embedding-ada-002 移轉至 text-embedding-3-large,您必須產生新的內嵌。

Model ID 要求上限 (權杖) 輸出維度 訓練資料 (上限)
text-embedding-ada-002 (版本 2) 8,191 1,536 2021 年 9 月
text-embedding-ada-002 (版本 1) 2,046 1,536 2021 年 9 月
text-embedding-3-large 8,191 3,072 2021 年 9 月
text-embedding-3-small 8,191 1,536 2021 年 9 月

注意

傳送輸入陣列以進行內嵌時,每次呼叫內嵌端點時陣列中輸入項目的數目上限為 2048。

公用雲端區域

區域 text-embedding-ada-0021 text-embedding-ada-002, 2 text-embedding-3-small1 text-embedding-3-large1
australiaeast - - -
brazilsouth - - -
canadaeast -
eastus
eastus2 -
francecentral - - -
japaneast - - -
northcentralus - - -
norwayeast - - -
southafricanorth - - -
southcentralus - -
southindia - - -
swedencentral - - -
switzerlandnorth - - -
uksouth - - -
westeurope - - -
westus - - -
westus3 - - -

Azure Government 區域

Azure Government 提供下列內嵌模型:

Model ID 模型可用性
text-embedding-ada-002 (版本 2) US Gov 維吉尼亞州
US Gov 亞利桑那州

DALL-E 模型

Model ID 功能可用性 要求上限 (字元)
dalle2 (預覽) 美國東部 1,000
dall-e-3 美國東部、澳大利亞東部、瑞典中部 4,000

微調模型

未訓練 babbage-002davinci-002 以遵循指示進行操作。 查詢這些基礎模型只能作為微調版本的參考點,以評估訓練的進度。

gpt-35-turbo - 此模型的微調僅限於區域子集,而且在基礎模型可用的每個區域中並非都可用。

Model ID 微調區域 要求上限 (權杖) 訓練資料 (上限)
babbage-002 美國中北部
瑞典中部
瑞士西部
16,384 2021 年 9 月
davinci-002 美國中北部
瑞典中部
瑞士西部
16,384 2021 年 9 月
gpt-35-turbo (0613) 美國東部 2
美國中北部
瑞典中部
瑞士西部
4,096 2021 年 9 月
gpt-35-turbo (1106) 美國東部 2
美國中北部
瑞典中部
瑞士西部
輸入:16,385
輸出:4,096
2021 年 9 月
gpt-35-turbo (0125) 美國東部 2
美國中北部
瑞典中部
瑞士西部
16,385 2021 年 9 月

耳語模型

Model ID 模型可用性 要求上限 (音訊檔案大小)
whisper 美國東部 2
美國中北部
挪威東部
印度南部
瑞典中部
西歐
25 MB

文字轉換語音模型 (預覽版)

Model ID 模型可用性
tts-1 美國中北部
瑞典中部
tts-1-hd 美國中北部
瑞典中部

助理 (預覽版)

對於助理,您需要支援的模型和支援的區域組合。 某些工具和功能需要最新的模型。 助理 API、SDK、Azure AI Studio 和 Azure OpenAI Studio 提供下列模型。 下表適用於隨用隨付。 如需布建輸送量單位 (PTU) 可用性的相關信息,請參閱 布建的輸送量

區域 gpt-35-turbo (0613) gpt-35-turbo (1106) gpt-4 (0613) gpt-4 (1106) gpt-4 (0125)
澳大利亞東部
美國東部
美國東部 2
法國中部
挪威東部
瑞典中部
英國南部

下一步