共用方式為


Azure OpenAI 服務的新功能

本文提供 Azure OpenAI 的最新版本和主要文件更新摘要。

2024 年 6 月

微調的權杖型計費

  • Azure OpenAI 微調計費現在是以訓練檔案中的權杖數目為基礎,而不是總耗用訓練時間。 這可能會導致某些訓練執行的成本大幅降低,並讓預估微調成本變得更加容易。 若要深入了解,您可以參閱官方公告

GPT-4o 在新區域中發行

  • GPT-4o 現在也可用於:
    • 瑞典中部標準區域部署。
    • 澳大利亞東部、加拿大東部、日本東部、南韓中部、瑞典中部、瑞士北部與美國西部 3 進行佈建的部署。

如需模型可用性的最新資訊,請參閱模型頁面

小幫手的客戶自控金鑰 (CMK) 支援

小幫手中的執行緒和檔案現在支援下列區域中的 CMK:

  • 美國西部 3

2024 年 5 月

GPT-4o 佈建的部署

gpt-4o版本:2024-05-13 可用於標準和佈建的部署。 佈建和標準模型部署同時接受文字和影像/視覺推斷要求。 如需模型區域可用性的資訊,請參閱適用於佈建部署的模型矩陣。

小幫手 v2 (預覽版)

小幫手 API 的重新整理現已公開提供。 其中包含下列更新:

  • 檔案搜尋工具和向量儲存體
  • 用於管理權杖使用方式的最大完成和最大提示權杖支援
  • 用於強制小幫手使用指定工具的tool_choice參數。 您現在可以使用小幫手角色來建立訊息,以在執行緒中建立自訂對話歷史記錄。
  • 支援 temperaturetop_presponse_format參數
  • 串流和輪詢支援。 您可以使用 Python SDK 中的協助程式函式來建立執行和串流回應。 我們同時新增輪詢 SDK 協助程式來共享物件狀態更新,而不需要輪詢。
  • 使用 Azure OpenAI Studio 來實驗 Logic Apps 和函式呼叫。 將 Logic Apps 中實作的 REST API 作為函式匯入,工作室會根據使用者提示自動叫用該函式 (作為 Logic Apps 工作流程)。
  • Microsoft Research 的 AutoGen 提供多代理程式對話架構,可在各種應用程式中方便建立大型語言模型 (LLM) 工作流程。 Azure OpenAI 小幫手現在已透過 GPTAssistantAgent 整合到 AutoGen 中,這是一個新的實驗代理程式,可讓您順暢地將小幫手新增至 AutoGen 型多代理程式工作流程。 這可讓多個 Azure OpenAI 小幫手專門用於協作和處理複雜的工作或領域。
  • 支援下列區域中gpt-3.5-turbo-0125微調模型:
    • 美國東部 2
    • 瑞典中部
  • 已針對下列專案展開區域支援
    • 日本東部
    • 英國南部
    • 美國西部
    • 美國西部 3
    • 挪威東部

如需詳細資訊,請參閱小幫手的部落格文章

GPT-4o 模型正式發行 (GA)

GPT-4o (「o 表示為 omni」) 是 OpenAI 於 2024 年 5 月 13 日推出的最新模型。

  • GPT-4o 將文字和影像整合在單一模型中,使其能夠同時處理多個資料類型。 這種多模式方法可增強人類電腦互動的精準度和回應性。
  • GPT-4o 在英語文字和編碼工作時會與 GPT-4 Turbo 進行比對,同時在非英文語言和視覺工作中提供卓越的效能,為 AI 能力樹立新的基準。

如需模型區域可用性的資訊,請參閱模型頁面

全域標準部署類型 (預覽版)

全域部署可在與非全域供應專案相同的 Azure OpenAI 資源中使用,但可讓您利用 Azure 的全域基礎結構,以動態方式將流量路由傳送至資料中心,並針對每個要求提供最佳可用性。 全域標準會為新模型提供最高的預設配額,並且無需跨多個資源進行負載平衡。

如需詳細資訊,請參閱部署類型指南

微調更新

DALL-E 和包含視覺功能的 GPT-4 Turbo GA 可設定的內容篩選條件

為 DALL-E 2 和 3 以及包含視覺功能的 GPT-4 Turbo GA (gpt-4-turbo-2024-04-09) 部署建立自訂內容篩選條件。 內容篩選

適用於所有 Azure OpenAI 客戶的非同步篩選條件

在串流案例中以非同步方式執行篩選,以改善串流案例的延遲,現在適用於所有 Azure OpenAI 客戶。 內容篩選

提示盾

提示防護可保護由 Azure OpenAI 模型提供的應用程式免受兩種類型的攻擊:直接攻擊 (越獄) 和間接攻擊。 間接攻擊 (也稱為「間接提示攻擊」或「跨網域提示插入攻擊」) 是一種攻擊類型,由生成式 AI 模型提供的系統,當應用程式處理非應用程式開發人員或使用者直接撰寫的資訊時,就可能會發生這種攻擊。 內容篩選

2024-05-01-preview API 版本

GPT-4 Turbo 模型正式發行 (GA)

GPT-4 Turbo 的最新 GA 版本為:

  • gpt-4版本:turbo-2024-04-09

這是下列預覽模型的取代:

  • gpt-4版本:1106-Preview
  • gpt-4版本:0125-Preview
  • gpt-4版本:vision-preview

OpenAI 與 Azure OpenAI GPT-4 Turbo GA 模型之間的差異

  • OpenAI 的最新 0409 turbo 模型版本支援所有推斷要求的 JSON 模式和函式呼叫。
  • Azure OpenAI 的最新 turbo-2024-04-09 版本目前不支援以影像 (視覺) 輸入進行推斷要求時使用 JSON 模式和函式呼叫。 以文字為基礎的輸入要求 (沒有 image_url 和內嵌影像的要求) 支援 JSON 模式和函式呼叫。

GPT-4 視覺預覽的差異

  • Azure AI 特定視覺增強功能與包含視覺功能之 GPT-4 Turbo 的整合,並不支援gpt-4版本:turbo-2024-04-09。 這包括光學字元辨識 (OCR)、物件基礎、影片提示,以及使用影像改善資料的處理。

GPT-4 Turbo 佈建的受控可用性

  • gpt-4版本:turbo-2024-04-09可用於標準和佈建的部署。 目前此模型的佈建版本不支援影像/視覺推斷要求。 此模型的佈建部署只接受文字輸入。 標準模型部署同時接受文字和影像/視覺推斷要求。

區域可用性

如需模型區域可用性的資訊,請參閱適用於標準的模型矩陣,以及佈建的部署

部署包含視覺功能的 GPT-4 Turbo GA

若要從 Studio UI 部署 GA 模型,請選取 [GPT-4],然後從下拉式功能表中選擇 turbo-2024-04-09 版本。 gpt-4-turbo-2024-04-09 模型的預設配額會與 GPT-4-Turbo 目前的配額相同。 請參閱區域配額限制。

2024 年 4 月

美國東部 2 和瑞士西部兩個新區域現在支援微調

微調現已提供下列支援:

美國東部 2

  • gpt-35-turbo (0613)
  • gpt-35-turbo (1106)
  • gpt-35-turbo (0125)

瑞士西部

  • babbage-002
  • davinci-002
  • gpt-35-turbo (0613)
  • gpt-35-turbo (1106)
  • gpt-35-turbo (0125)

檢查模型頁面,以取得每個區域中模型可用性和微調支援的最新資訊。

多回合聊天訓練範例

微調現在支援多回合聊天訓練範例

GPT-4 (0125) 可用於以自有資料為基礎的 Azure OpenAI

您現在可以在可用區域透過以自有資料為基礎的 Azure OpenAI 使用 GPT-4 (0125) 模型。

2024 年 3 月

Azure OpenAI Studio 中的風險與安全監視

Azure OpenAI Studio 現在會針對使用內容篩選條件設定的每個部署提供風險與安全儀表板。 使用其來檢查篩選活動的結果。 然後,您可以調整篩選條件設定,以更好地滿足企業需求,並符合負責任 AI 原則。

使用風險與安全監視

以自有資料為基礎的 Azure OpenAI 更新

2024 年 2 月 1 日正式發行 (GA) API 版本

這是最新的 GA API 版本,並且是舊版 2023-05-15 GA 版本的取代版。 此版本新增支援最新的 Azure OpenAI GA 功能,例如 Whisper、DALLE-3、微調、以自有資料為基礎等等。

仍處於預覽狀態的功能,例如小幫手、文字轉換語音 (TTS),以自有資料為基礎的特定資料來源,仍然需要預覽 API 版本。 如需詳細資訊,請參閱我們的 API 版本生命週期指南

Whisper 正式發行 (GA)

Whisper 語音轉換文字模型現在是 REST 和 Python 的 GA。 用戶端程式庫 SDK 目前仍處於公開預覽狀態。

請遵循快速入門來試用 Whisper。

DALL-E 3 正式發行 (GA)

DALL-E 3 影像產生模型現在是 REST 和 Python 的 GA。 用戶端程式庫 SDK 目前仍處於公開預覽狀態。

請遵循快速入門來試用 DALL-E 3。

DALL-E 3 的新區域支援

除了 SwedenCentral 之外,您現在還可以使用 East USAustraliaEast Azure 區域中的 Azure OpenAI 資源存取 DALL-E 3。

模型取代和淘汰

我們已新增頁面來追蹤 Azure OpenAI 服務中的模型取代和淘汰。 此頁面提供目前可用、已取代和淘汰之模型的相關資訊。

2024-03-01-preview API 已發行

2024-03-01-preview 具有與 2024-02-15-preview 相同的功能,並新增兩個新的參數進行內嵌:

  • encoding_format 可讓您指定要在 floatbase64 中產生內嵌的格式。 預設值為 float
  • dimensions 可讓您設定輸出內嵌的數目。 只有新的第三代內嵌模型才支援此參數:text-embedding-3-largetext-embedding-3-small。 一般而言,從計算、記憶體和儲存體的觀點來看,較大的內嵌成本會更高。 調整維度數目的功能可讓您更充分掌控整體成本和效能。 OpenAI 1.x Python 程式庫的所有版本都不支援 dimensions 參數,若要利用此參數,建議您升級至最新版本:pip install openai --upgrade

如果您目前正使用預覽 API 版本來利用最新功能,建議您參閱 API 版本生命週期一文,以追蹤目前 API 版本支援的時間。

更新至 GPT-4-1106-Preview 升級方案

計劃原定於 2024 年 3 月 8 日從 gpt-4 1106-Preview 部署升級到 gpt-4 0125-Preview 的方案已不再進行。 設定為「自動更新為預設值」和「過期時升級」的 gpt-4 版本 1106-Preview 和 0125-Preview 的部署,將在模型的穩定版本發佈後開始升級。

如需升級流程的詳細資訊,請參閱模型頁面

2024 年 2 月

GPT-3.5-turbo-0125 模型可供使用

此模型進行了各種改善,包括提高以要求格式回應的精確度,以及修正導致非英文語言函式呼叫的文字編碼問題的錯誤 (bug)。

如需模型區域可用性和升級的資訊,請參閱模型頁面

第三代內嵌模型可供使用

  • text-embedding-3-large
  • text-embedding-3-small

在測試中,OpenAI 報告顯示大型和小型第三代內嵌模型在 MIRACL 基準中提供了更好的平均多語言擷取效能,同時在 MTEB 基準中仍保持比第二代 text-embedding-ada-002 模型更好的英文工作效能。

如需模型區域可用性和升級的資訊,請參閱模型頁面

GPT-3.5 Turbo 配額彙總

為了簡化 GPT-3.5-Turbo 模型 (包括 16k) 的不同版本之間的移轉,我們將把所有 GPT-3.5-Turbo 配額合併成單一配額值。

  • 任何已核准新增配額的客戶都將獲得反映先前新增的總配額。

  • 預設情況下,任何目前跨模型版本的總使用量小於預設值的客戶都將獲得新的合併總配額。

GPT-4-0125-preview 模型可供使用

gpt-4 模型版本 0125-preview 現在可在美國東部、美國中北部和美國中南部區域的 Azure OpenAI 服務上使用。 部署 gpt-4 版本 1106-preview 的客戶將在未來幾週內自動升級至 0125-preview

如需模型區域可用性和升級的資訊,請參閱模型頁面

小幫手 API 公開預覽版

Azure OpenAI 現在支援為 OpenAI 的 GPT 提供支援的 API。 Azure OpenAI Assistants (預覽版) 可讓您透過自訂指示和程式碼解譯器等進階工具以及自訂函式來建立適合您需求的 AI 小幫手。 若要深入了解,請參閱:

OpenAI 文字轉換語音的語音公開預覽版

Azure OpenAI 服務現在支援具有 OpenAI 語音的文字轉換語音 API。 從您提供的文字取得 AI 產生的語音。 若要深入了解,請參閱概觀指南,並嘗試快速入門

注意

Azure AI 語音同時支援 OpenAI 文字轉換語音。 若要深入了解,請參閱透過 Azure OpenAI 服務或透過 Azure AI 語音實現 OpenAI 文字轉換語音聲音指南。

新的微調功能和模型支援

以自有資料為基礎的 Azure OpenAI 的新區域支援

您現在可以在下列 Azure 區域中使用以自有資料為基礎的 Azure OpenAI:

  • 南非北部

以自有資料為基礎的 Azure OpenAI 正式發行

2023 年 12 月

以自有資料為基礎的 Azure OpenAI

  • 以自有資料為基礎的 Azure OpenAI 的完整 VPN 和私人端點支援,包括對以下內容的安全性支援:儲存體帳戶、Azure OpenAI 資源和 Azure AI 搜尋服務資源。
  • 使用以自有資料為基礎的 Azure OpenAI 安全地透過虛擬網路和私人端點來保護資料的新文章。

包含視覺功能的 GPT-4 Turbo 現可供使用

Azure OpenAI 服務上包含視覺功能的 GPT-4 Turbo 現在處於公開預覽狀態。 包含視覺功能的 GPT-4 Turbo 是由 OpenAI 開發的大型多模態模型 (LMM),可分析影像並針對影像問題提供文字回應。 它同時包含自然語言處理和視覺理解。 透過增強模式,您可以使用 Azure AI 視覺功能,從影像產生其他見解。

  • 使用 Azure OpenAI Playground,以無程式碼體驗探索包含視覺功能的 GPT-4 Turbo。 請參閱快速入門指南以深入了解。
  • 使用包含視覺功能的 GPT-4 Turbo 進行視覺增強現已在 Azure OpenAI Playground 中提供,包括對光學字元辨識、物件接地、「新增資料」的影像支援以及對視訊提示的支援。
  • 使用 REST API 直接呼叫聊天 API。
  • 區域可用性目前僅限於 SwitzerlandNorthSwedenCentralWestUSAustraliaEast
  • 深入了解包含視覺功能的 GPT-4 Turbo 和其他常見問題的已知限制。

2023 年 11 月

以自有資料為基礎的 Azure OpenAI 中的新資料來源支援

GPT-4 Turbo 預覽版與 GPT-3.5-Turbo-1106 發行

這兩個模型都是 OpenAI 的最新版本,具有改善的指令遵循、JSON 模式可重現的輸出以及平行函式呼叫。

  • GPT-4 Turbo 預覽版具有 128,000 個權杖的最大內容視窗,而且可以產生 4,096 個輸出權杖。 其擁有截至 2023 年 4 月的最新訓練資料。 此模型目前為預覽狀態,因此不建議生產使用。 一旦穩定版本可供使用,此預覽模型的所有部署都將自動更新。

  • GPT-3.5-Turbo-1106 具有 16,385 個權杖的最大內容視窗,而且可以產生 4,096 個輸出權杖。

如需模型區域可用性的資訊,請參閱模型頁面

每個地區的模型都有自己唯一的配額配置

DALL-E 3 公開預覽

DALL-E 3 是 OpenAI 的最新影像產生模型。 其具有增強的影像品質、更複雜的場景,以及在影像中轉譯文字時改善效能。 同時隨附更多外觀比例選項。 DALL-E 3 可透過 OpenAI Studio 和 REST API 取得。 您的 OpenAI 資源必須位於 SwedenCentral Azure 區域中。

DALL-E 3 包含內建的提示重寫,以增強影像、減少偏差,以及增加自然變化。

請遵循快速入門來試用 DALL-E 3。

負責 AI

  • 擴充客戶可設定性:所有 Azure OpenAI 客戶現在可以針對仇恨、暴力、性及自我傷害類別設定所有嚴重性層級 (低、中、高),包括僅篩選高嚴重性內容。 設定內容篩選條件

  • 所有 DALL-E 模型中的內容憑證:來自所有 DALL-E 模型的 AI 產生的影像現在包含數位憑證,以 AI 產生的方式揭露內容。 顯示影像資產的應用程式可以利用開放原始碼 Content Authenticity Initiative SDK,在其 AI 產生的影像中顯示憑證。 Azure OpenAI 中的內容憑證

  • 新的 RAI 模型

    • 越獄風險偵測:越獄攻擊是使用者提示,其設計目的是要引發產生 AI 模型,以展示其定型的行為,以避免或打破系統訊息中設定的規則。 越獄風險偵測模型為可選服務 (預設為關閉),可在標註和篩選模型中取得。 其根據使用者提示執行。
    • 受保護的資料文字:受保護的資料文字描述已知的文字內容 (例如歌曲歌詞、文章、食譜和選取的 Web 內容),這些內容可由大型語言模型輸出。 受保護的資料文字為可選服務 (預設為關閉),可在標註和篩選模型中取得。 其會根據 LLM 完成執行。
    • 受保護的資料程式碼:受保護的資料程式碼描述與公用存放庫的一組原始程式碼相符的原始程式碼,這些原始程式碼可由大型語言模型輸出,而不需要適當的來源存放庫引文。 受保護的資料程式碼為可選服務 (預設為關閉),可在標註和篩選模型中取得。 其會根據 LLM 完成執行。

    設定內容篩選條件

  • 封鎖清單:客戶現在可以藉由在篩選條件中建立自訂封鎖清單,快速自訂提示和完成的內容篩選行為。 自訂封鎖清單可讓篩選條件在自訂模式清單上採取動作,例如特定字詞或 Regex 模式。 除了自訂封鎖清單之外,我們還提供 Microsoft 粗話封鎖清單 (英文)。 使用封鎖清單

2023 年 10 月

新的微調模型 (預覽版)

以自有資料為基礎的 Azure OpenAI

  • 新的自訂參數可用於判斷所擷取的文件數目和嚴謹度。
    • 嚴謹度設定會將文件分類為與查詢相關的閾值。
    • 擷取的文件設定會指定用來產生回應之資料索引中評分最高的文件數目。
  • 您可以在 Azure OpenAI Studio 中看到資料擷取/上傳狀態。
  • 支援 Blob 容器的私人端點和 VPN。

2023 年 9 月

GPT-4

GPT-4 和 GPT-4-32k 現在可供所有 Azure OpenAI 服務客戶使用。 客戶不再需要申請等候清單,才能使用 GPT-4 和 GPT-4-32k (有限存取權註冊需求會繼續申請所有 Azure OpenAI 模型)。 可用性可能因區域而異。 檢查模型頁面,以取得每個區域中模型可用性的最新資訊。

GPT-3.5 Turbo 指示

Azure OpenAI 服務現在支援 GPT-3.5 Turbo 指示模型。 此模型具有與 text-davinci-003 媲美的效能,可與完成 API 搭配使用。 檢查模型頁面,以取得每個區域中模型可用性的最新資訊。

Whisper 公開預覽

Azure OpenAI 服務現在支援由 OpenAI 的 Whisper 模型所提供的語音轉換文字 API。 根據您提供的語音音訊取得 AI 產生的文字。 如需詳細資訊,請參閱快速入門

注意

Azure AI 語音同時透過批次謄寫 API 支援 OpenAI 的 Whisper 模型。 若要深入了解,請參閱建立批次轉譯指南。 請參閱什麼是 Whisper 模型?深入了解何時使用 Azure AI 語音與Azure OpenAI 服務。

新區域

  • Azure OpenAI 現已在瑞典中部和瑞士北部地區推出。 檢查模型頁面,以取得每個區域中模型可用性的最新資訊。

區域配額限制調高

  • 增加至特定模型和區域的最大預設配額限制。 將工作負載遷移至這些模型和區域,可讓您能夠利用每分鐘較高的權杖 (TPM)。

2023 年 8 月

以自有資料為基礎的 Azure OpenAI (預覽版) 更新

2023 年 7 月

函式呼叫支援

內嵌輸入陣列增加

新區域

  • Azure OpenAI 現在也適用於加拿大東部、美國東部 2、日本東部和美國中北部區域。 檢查模型頁面,以取得每個區域中模型可用性的最新資訊。

2023 年 6 月

以自有資料為基礎的 Azure OpenAI (預覽版)

新版本的 gpt-35-turbo 和 gpt-4 模型

  • gpt-35-turbo (0613 版)
  • gpt-35-turbo-16k (0613 版)
  • gpt-4 (0613 版)
  • gpt-4-32k (0613 版)

英國南部

  • Azure OpenAI 現在已對英國南部區域開放。 檢查模型頁面,以取得每個區域中模型可用性的最新資訊。

內容篩選與註釋 (預覽版)

  • 如何使用 Azure OpenAI 服務設定內容篩選
  • 啟用注釋,以在 GPT 式完成和聊天完成呼叫中檢視內容篩選類別和嚴重性資訊。

配額

2023 年 5 月

JAVA 與 JavaScript SDK 支援

  • 新的 Azure OpenAI 預覽軟體開發套件提供了對 JavaScriptJAVA 的支援。

Azure OpenAI 聊天完成正式發行 (GA)

  • 正式發行支援:
    • 聊天完成 API 版本 2023-05-15
    • GPT-35-Turbo 模型。
    • GPT-4 模型系列。

如果您目前使用 2023-03-15-preview API,建議您移轉至 GA 2023-05-15 API。 如果您目前使用 API 版本 2022-12-01,此 API 仍為 GA,但不包含最新的聊天完成功能。

重要

使用目前版本的 GPT-35-Turbo 模型和完成端點仍處於預覽狀態。

法國中部

  • Azure OpenAI 現在已對法國中部區域開放。 檢查模型頁面,以取得每個區域中模型可用性的最新資訊。

2023 年 4 月

  • DALL-E 2 公開預覽。 Azure OpenAI 服務現在支援由 OpenAI 的 DALL-E 2 模型所提供的影像產生 API。 根據您提供的描述性文字取得 AI 產生的影像。 如需詳細資訊,請參閱快速入門。 如需要求存取權,現有的 Azure OpenAI 客戶可以透過填寫此表單以提出申請

  • 現在,自訂模型的非作用中部署會在 15 天後刪除;模型仍可供重新部署。 如果自訂 (微調) 模型是在超過十五 (15) 天前部署,且在此期間未對其進行完成或聊天完成呼叫,則將自動刪除部署 (針對該部署,不會產生進一步的裝載費用)。 基本自訂模型將維持可用狀態,且可以隨時重新部署。 若要深入了解,請參閱操作說明文章

2023 年 3 月

  • GPT-4 系列模型現在可在 Azure OpenAI 上預覽。 如需要求存取權,現有的 Azure OpenAI 客戶可以透過填寫此表單以提出申請。 這些模型目前於美國東部和美國中南部區域提供。

  • 3/21 發行的 GPT-35-Turbo 和 GPT-4 模型的新聊天完成 API 預覽版。 若要深入了解,請參閱更新的快速入門操作方式文章。

  • GPT-35-Turbo 預覽版。 若要深入了解,請參閱操作方式文章

  • 為微調增加的訓練限制:所有模型的最大訓練作業大小 (訓練檔案中的權杖) x (時期數) 為 20 億個權杖。 我們也已將訓練作業上限從 120 增加到 720 小時。

  • 將其他使用案例新增至您現有的存取權。  先前,新增使用案例的流程需要客戶重新申請服務。 現在,我們推出新的流程,讓您快速新增使用案例以使用服務。 此流程遵循 Azure AI 服務內已建立的有限存取流程。 現有的客戶可以在這裡證明任何和所有新的使用案例。 請注意,每當您要針對原本未套用的新使用案例使用服務時,都需要這麼做。

2023 年 2 月

新功能

更新

  • 內容篩選依預設會開啟。

新文章:

新訓練課程:

2023 年 1 月

新功能

  • 服務 GA。 Azure OpenAI 服務現已正式推出。

  • 新模型:新增最新的文字模型、text-davinci-003 (美國東部、西歐)、text-ada-embeddings-002 (美國東部、美國中南部、西歐)

2022 年 12 月

新功能

  • OpenAI 的最新模型。 Azure OpenAI 可讓您存取所有最新的模型,包括 GPT-3.5 系列。

  • 新 API 版本 (2022-12-01)。 此更新包含數個要求的增強功能,包括 API 回應中的權杖使用資訊、改善檔案的錯誤訊息、在微調建立資料結構上與 OpenAI 保持一致,以及支援尾碼參數,以允許自訂微調作業的命名。 ​

  • 每秒更高的要求限制。 非 Davinci 模型為 50。 Davinci 模型為 20。

  • 更快速地微調部署。 在 10 分鐘內部署 Ada 和 Curie 微調模型。

  • 更高的訓練限制: Ada、Bightge 和 Curie 為 40M 訓練權杖。 Davinci 為 10M。

  • 請求修改濫用和誤用資料記錄及人工檢閱的流程。 目前,服務會記錄要求/回應資料,以便進行濫用和誤用偵測,以確保這些功能強大的模型不被濫用。 不過,許多客戶都有嚴格的資料隱私權和安全性需求,需要更充分地控制其資料。 為了支援這些使用案例,我們會發佈新的流程,讓客戶修改內容篩選原則,或關閉低風險使用案例的濫用記錄。 此流程遵循 Azure AI 服務內已建立的有限存取流程,而現有的 OpenAI 客戶可以在此處申請

  • 客戶自控金鑰加密。 CMK 提供用來儲存訓練資料和自訂模型的自有加密金鑰,讓客戶在 Azure OpenAI 的資料管理中取得更充分的控制能力。 客戶自控金鑰 (CMK) 也稱為自備金鑰 (BYOK),可提供更大的彈性來建立、輪替、停用及撤銷存取控制。 您也可稽核用來保護資料的加密金鑰。 從我們的待用加密文件中深入了解

  • Lockbox 支援

  • SOC-2 合規性

  • 透過 Azure 資源健康狀態、成本分析和計量與診斷設定進行記錄與診斷。

  • Studio 改善項目。 許多 Studio 工作流程的可用性改善項目,包括 Azure AD 角色支援,以控制小組中誰可以建立微調的模型和部署。

變更 (中斷性)

微調建立 API 要求已更新,以符合 OpenAI 的架構。

預覽 API 版本:

{​
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",​
    "hyperparams": { ​
        "batch_size": 4,​
        "learning_rate_multiplier": 0.1,​
        "n_epochs": 4,​
        "prompt_loss_weight": 0.1,​
    }​
}

API 版本 2022-12-01:

{​
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",​
    "batch_size": 4,​
    "learning_rate_multiplier": 0.1,​
    "n_epochs": 4,​
    "prompt_loss_weight": 0.1,​
}

內容篩選依預設會暫時關閉。 Azure 內容仲裁的運作方式與 Azure OpenAI 不同。 Azure OpenAI 會在產生呼叫期間執行內容篩選,以偵測有害或濫用的內容,並從回應中加以篩選。 深入了解​

​這些模型將在 2023 第 1 季中重新啟用,且預設為開啟。 ​

客戶動作

下一步

深入了解驅動 Azure OpenAI 的基礎模型