Azure OpenAI 服務的新功能

2024 年 4 月

美國東部 2 和瑞士西部兩個新區域現在支援微調

微調現已提供下列支援:

美國東部 2

  • gpt-35-turbo (0613)
  • gpt-35-turbo (1106)
  • gpt-35-turbo (0125)

瑞士西部

  • babbage-002
  • davinci-002
  • gpt-35-turbo (0613)
  • gpt-35-turbo (1106)
  • gpt-35-turbo (0125)

請查看 模型頁面,以取得每個區域中模型可用性和微調支援的最新資訊。

多回合聊天訓練範例

微調現在支援 多回合聊天訓練範例

GPT-4 (0125) 適用於 Azure OpenAI On Your Data

您現在可以在 可用的區域中 使用 GPT-4 (0125) 模型搭配 Azure OpenAI On Your Data。

2024 年 3 月

Azure OpenAI Studio 中的風險與 保管庫 監視

Azure OpenAI Studio 現在會針對使用內容篩選設定的每個部署提供風險和 保管庫 ty 儀錶板。 使用它來檢查篩選活動的結果。 然後,您可以調整篩選組態,以更好地滿足業務需求,並符合負責任 AI 原則。

使用風險和 保管庫監視

Azure OpenAI On Your Data updates

  • 您現在可以連線到 Elasticsearch 向量資料庫,以便與 Azure OpenAI On Your Data 搭配使用。
  • 您可以在資料擷取期間使用 區塊大小參數 ,在索引中設定任何指定數據區塊的令牌數目上限。

2024-02-01 公開上市 (GA) API 已發行

這是最新的 GA API 版本,而且是先前 2023-05-15 GA 版本的取代專案。 此版本新增支援最新的 Azure OpenAI GA 功能,例如 Whisper、DALLE-3、微調數據等等。

仍然處於預覽狀態的功能,例如小幫手、文字到語音轉換(TTS),某些位於數據源上,仍然需要預覽 API 版本。 如需詳細資訊,請參閱我們的 API 版本生命週期指南

低語正式上市 (GA)

適用於 REST 和 Python 的 Whisper 語音轉換文字模型現在是 GA。 用戶端連結庫 SDK 目前仍處於公開預覽狀態。

請遵循 快速入門來試用 Whisper。

DALL-E 3 正式上市 (GA)

DALL-E 3 映射產生模型現在是 REST 和 Python 的 GA。 用戶端連結庫 SDK 目前仍處於公開預覽狀態。

請遵循 快速入門來試用 DALL-E 3。

DALL-E 3 的新區域支援

除了 之外,SwedenCentral您現在可以在 或 AustraliaEast Azure 區域中使用 Azure OpenAI 資源East US存取 DALL-E 3。

模型淘汰和淘汰

我們已新增頁面來追蹤 Azure OpenAI 服務中的模型淘汰和淘汰 。 此頁面提供目前可用、已淘汰和淘汰之模型的相關信息。

2024-03-01-preview API 已發行

2024-03-01-preview 具有與 相同的功能 2024-02-15-preview ,並新增兩個新的參數以進行內嵌:

  • encoding_format可讓您指定要在或base64float產生內嵌的格式。 預設值為 float
  • dimensions 可讓您設定輸出內嵌的數目。 只有新第三代內嵌模型才支援此參數: text-embedding-3-largetext-embedding-3-small。 一般而言,從計算、記憶體和儲存體的觀點來看,較大的內嵌成本會更高。 調整維度數目的功能可讓您更充分掌控整體成本和效能。 OpenAI 1.x Python 程式庫的所有版本都不支援 dimensions 參數,若要利用此參數,建議您升級至最新版本:pip install openai --upgrade

如果您目前使用預覽 API 版本來利用最新功能,建議您諮詢 API 版本生命週期 一文,以追蹤目前 API 版本將支援多久。

更新至 GPT-4-1106-Preview 升級方案

2024 年 3 月 8 日已排程的 gpt-4 1106-Preview 部署升級至 gpt-4 0125-Preview。 gpt-4版本 1106-Preview 和 0125-Preview 的部署會設定為「自動更新為預設值」,而「到期時升級」將會在發行模型的穩定版本之後開始升級。

如需升級程式的詳細資訊,請參閱 模型頁面

2024 年 2 月

GPT-3.5-turbo-0125 型號可用

此模型具有各種改進功能,包括回應要求格式的精確度較高,以及錯誤修正,導致非英文語言函數調用的文字編碼問題。

如需模型區域可用性和升級的資訊,請參閱 模型頁面

第三代內嵌模型可供使用

  • text-embedding-3-large
  • text-embedding-3-small

在測試中,OpenAI 會報告大型和小型第三代內嵌模型,使用MIRACL基準提供更佳的平均多語言擷取效能,同時仍維持較第二代文字內嵌-ada-002 模型更好的英文工作效能。

如需模型區域可用性和升級的資訊,請參閱 模型頁面

GPT-3.5 Turbo 配額匯總

為了簡化 GPT-3.5-Turbo 模型的不同版本之間的移轉(包括 16k),我們將將所有 GPT-3.5-Turbo 配額合併成單一配額值。

  • 已核准配額增加的任何客戶,都會合併反映先前增加的配額總計。

  • 任何目前模型版本使用量總計小於預設值的客戶,預設會取得新的合併總配額。

GPT-4-0125-preview 模型可用

模型 gpt-4 版本 0125-preview 現在可在美國東部、美國中北部和美國中南部區域的 Azure OpenAI 服務上使用。 部署版本1106-preview的客戶gpt-4將會在未來幾周內自動升級至 0125-preview

如需模型區域可用性和升級的資訊,請參閱 模型頁面

小幫手 API 公開預覽

Azure OpenAI 現在支援支援支援 OpenAI GPT 的 API。 Azure OpenAI Assistants (預覽版) 可讓您透過自定義指示和進階工具,例如程式代碼解釋器和自定義函式,來建立專為您需求量身打造的 AI 助理。 若要深入了解,請參閱:

OpenAI 文字到語音公開預覽

Azure OpenAI 服務現在支援具有 OpenAI 語音的文字到語音 API。 從您提供的文字取得 AI 產生的語音。 若要深入瞭解,請參閱 概觀指南 並嘗試 快速入門

注意

Azure AI 語音也支援 OpenAI 文字到語音語音。 若要深入了解,請參閱透過 Azure OpenAI 服務或透過 Azure AI 語音實現 OpenAI 文字轉換語音聲音指南。

新的微調功能和模型支援

Azure OpenAI On your Data 的新區域支援

您現在可以在下列 Azure 區域中使用 Azure OpenAI On Data:

  • 南非北部

Azure OpenAI on your Data General availability

2023 年 12 月

數據上的 Azure OpenAI

  • Azure OpenAI On Data 的完整 VPN 和私人端點支援,包括:記憶體帳戶、Azure OpenAI 資源和 Azure AI 搜尋服務 資源的安全性支援。
  • 使用虛擬網路和私人端點保護數據,以安全地使用 Azure OpenAI On Data 的新文章。

GPT-4 Turbo with Vision now available

GPT-4 Turbo with Vision on Azure OpenAI 服務現在處於公開預覽狀態。 GPT-4 Turbo with Vision 是 OpenAI 開發的大型多模式模型(LMM),可分析影像並提供文字回應,以回答有關影像的問題。 它同時包含自然語言處理和視覺理解。 透過增強模式,您可以使用 Azure AI 視覺 功能從影像產生其他見解。

  • 使用 Azure Open AI 遊樂場,在無程式代碼體驗中探索 GPT-4 Turbo 與 Vision 的功能。 在快速入門指南深入瞭解。
  • Azure Open AI 遊樂場現已提供使用 GPT-4 Turbo 搭配視覺的視覺增強功能,並包含光學字元辨識、物件地面、影像支援「新增您的數據」,以及影片提示的支援。
  • 使用 REST API 直接呼叫聊天 API
  • 區域可用性目前限制為SwitzerlandNorth、、 SwedenCentralWestUSAustraliaEast
  • 深入瞭解 GPT-4 Turbo 搭配視覺和其他 常見問題的已知限制。

2023 年 11 月

Azure OpenAI on your Data 中的新數據源支援

GPT-4 Turbo Preview & GPT-3.5-Turbo-1106 發行

這兩個模型都是 OpenAI 的最新版本,其指示如下: JSON 模式可重現的輸出,以及平行函數呼叫。

  • GPT-4 Turbo Preview 具有最多 128,000 個令牌的內容視窗,而且可以產生 4,096 個輸出令牌。 它有最新的訓練數據,知識在 2023 年 4 月為止。 此模型處於預覽狀態,不建議用於生產環境。 一旦穩定版本可供使用,此預覽模型的所有部署都會自動更新。

  • GPT-3.5-Turbo-1106 具有 16,385 個令牌的最大內容視窗,而且可以產生 4,096 個輸出令牌。

如需模型區域可用性的資訊, 請參閱模型頁面

模型有自己的每個區域 配額配置唯一。

DALL-E 3 公開預覽

DALL-E 3 是 OpenAI 的最新映像產生模型。 它具有增強的影像品質、更複雜的場景,以及在影像中轉譯文字時改善效能。 它也隨附更多外觀比例選項。 DALL-E 3 可透過 OpenAI Studio 和 REST API 取得。 您的 OpenAI 資源必須位於 SwedenCentral Azure 區域中。

DALL-E 3 包含內建的提示重寫,以增強影像、減少偏差,以及增加自然變化。

請遵循 快速入門來試用 DALL-E 3。

負責 AI

  • 擴大客戶設定能力:所有 Azure OpenAI 客戶現在可以針對仇恨、暴力、性及自我傷害類別設定所有嚴重性層級(低、中、高),包括僅篩選高嚴重性內容。 設定內容篩選

  • 所有 DALL-E 模型中的內容認證:來自所有 DALL-E 模型的 AI 產生的影像現在包含數位認證,以 AI 產生的內容。 顯示影像資產的應用程式可以利用 開放原始碼 內容真實性計劃 SDK,在其 AI 產生的影像中顯示認證。 Azure OpenAI 中的內容認證

  • 新的 RAI 模型

    • 越獄風險偵測:越獄攻擊是使用者提示,其設計目的是要引發產生 AI 模型,以展示其定型的行為,以避免或打破系統訊息中設定的規則。 越獄風險偵測模型是選擇性的(預設值關閉),可在批注和篩選模型中取得。 它會在使用者提示上執行。
    • 受保護的材料文字:受保護的材料文字描述已知的文字內容(例如歌曲歌詞、文章、食譜和選取的 Web 內容),這些內容可由大型語言模型輸出。 受保護的材質文字模型是選擇性的(預設值關閉),而且可在批注和篩選模型中取得。 它會在 LLM 完成時執行。
    • 受保護的材料程序代碼:受保護的材料程序代碼描述與公用存放庫的一組原始程式碼相符的原始程式碼,大型語言模型可以輸出,而不需要適當引文來源存放庫。 受保護的材料程序代碼模型是選擇性的(預設關閉),而且可在批注和篩選模型中取得。 它會在 LLM 完成時執行。

    設定內容篩選

  • 封鎖清單:客戶現在可以在篩選中建立自定義封鎖清單,以進一步自定義提示和完成的內容篩選行為。 自定義封鎖清單可讓篩選在自定義模式清單上採取動作,例如特定字詞或 regex 模式。 除了自定義封鎖清單之外,我們還提供 Microsoft 粗話封鎖清單(英文)。 使用封鎖清單

2023 年 10 月

新的微調模型 (預覽)

數據上的 Azure OpenAI

  • 用於判斷所擷取檔數目和嚴格性的新 自定義參數
    • 嚴格設定會將文件分類為與查詢相關的閾值。
    • 擷取的檔設定會指定用來產生回應之數據索引中評分最高的檔數目。
  • 您可以在 Azure OpenAI Studio 中看到數據擷取/上傳狀態。
  • 支援 Blob 容器的私人端點和 VPN。

2023 年 9 月

GPT-4

GPT-4 和 GPT-4-32k 現在可供所有 Azure OpenAI 服務客戶使用。 客戶不再需要申請等候清單,才能使用 GPT-4 和 GPT-4-32k(有限存取註冊需求會繼續申請所有 Azure OpenAI 模型)。 可用性可能會因區域而異。 如需 每個區域中模型可用性的最新資訊,請查看模型頁面

GPT-3.5 Turbo 指示

Azure OpenAI 服務現在支援 GPT-3.5 Turbo 指示模型。 此模型具有可比較 text-davinci-003 且可與完成 API 搭配使用的效能。 如需 每個區域中模型可用性的最新資訊,請查看模型頁面

低語公開預覽

Azure OpenAI 服務現在支援由 OpenAI 的 Whisper 模型所提供的語音轉換文字 API。 根據您提供的語音音訊取得 AI 產生的文字。 若要深入瞭解,請參閱 快速入門

注意

Azure AI 語音也透過批次轉譯 API 支援 OpenAI 的 Whisper 模型。 若要深入瞭解,請參閱 建立批次轉譯 指南。 請參閱什麼是 Whisper 模型?深入了解何時使用 Azure AI 語音與Azure OpenAI 服務。

新區域

區域配額限制增加

  • 增加至特定模型和區域的最大預設配額限制。 將工作負載移轉至 這些模型和區域 可讓您利用每分鐘較高的令牌 (TPM)。

2023 年 8 月

Azure OpenAI 關於您自己的資料 (預覽) 更新

2023 年 7 月

支援函式呼叫

內嵌輸入陣列增加

新區域

2023 年 6 月

在您自己的資料上使用 Azure OpenAI (預覽版)

  • Azure OpenAI On Your Data 現已可供預覽,可讓您與 GPT-35-Turbo 和 GPT-4 等 OpenAI 模型聊天,並根據您的數據接收回應。

新版本的 gpt-35-turbo 和 gpt-4 模型

  • gpt-35-turbo (版本 0613)
  • gpt-35-turbo-16k (版本 0613)
  • gpt-4 (版本 0613)
  • gpt-4-32k (版本 0613)

英國南部

內容篩選和批註 (預覽)

  • 如何使用 Azure OpenAI 服務設定 內容篩選
  • 啟用批注 ,以檢視內容篩選類別和嚴重性資訊,作為 GPT 型完成和聊天完成呼叫的一部分。

配額

2023 年 5 月

Java 和 JavaScript SDK 支援

  • 新的 Azure OpenAI 預覽版 SDK 提供 JavaScriptJava 的支援。

Azure OpenAI 聊天完成公開上市 (GA)

  • 正式運作支援:
    • 聊天完成 API 版本 2023-05-15
    • GPT-35-Turbo 模型。
    • GPT-4 模型系列。

如果您目前使用 2023-03-15-preview API,建議您移轉至 GA 2023-05-15 API。 如果您目前使用 API 版本 2022-12-01 ,此 API 仍為 GA,但不包含最新的聊天完成功能。

重要

使用目前版本的 GPT-35-Turbo 模型與完成端點維持預覽狀態。

法國中部

2023 年 4 月

  • DALL-E 2 公開預覽。 Azure OpenAI 服務現在支援由 OpenAI 的 DALL-E 2 模型所提供的映射產生 API。 根據您提供的描述性文字取得 AI 產生的影像。 若要深入瞭解,請參閱 快速入門。 若要要求存取權,現有的 Azure OpenAI 客戶可以 填寫此表單來套用。

  • 自定義模型的非使用中部署現在將在15天后刪除;模型仍可供重新部署使用。 如果自訂 (微調) 模型是在超過十五 (15) 天前部署,且在此期間未對其進行完成或聊天完成呼叫,則將自動刪除部署 (針對該部署,不會產生進一步的裝載費用)。 基本自訂模型將維持可用狀態,且可以隨時重新部署。 若要深入了解,請參閱操作說明文章

2023 年 3 月

  • GPT-4 系列模型現在可在 Azure OpenAI 上預覽。 若要要求存取權,現有的 Azure OpenAI 客戶可以 填寫此表單來套用。 這些模型目前位於美國東部和美國中南部區域。

  • 適用於 GPT-35-Turbo 和 GPT-4 模型的新聊天完成 API 於 3/21 上預覽版。 若要深入瞭解, 請參閱更新的 快速入門和 操作說明文章

  • GPT-35-Turbo 預覽。 若要深入瞭解,請參閱 操作說明文章

  • 微調的定型限制增加:所有模型的訓練作業大小上限 (訓練檔案中的令牌) x (epochs 的標記數) 為 20 億個令牌。 我們還將培訓工作上限從120個增加到720小時。

  • 將其他使用案例新增至您現有的存取權。  先前,新增使用案例的流程需要客戶重新申請服務。 現在,我們推出新的流程,讓您快速新增使用案例以使用服務。 此流程遵循 Azure AI 服務內已建立的有限存取流程。 現有的客戶可以在這裡證明任何和所有新的使用案例。 請注意,每當您要針對原本未套用的新使用案例使用服務時,都需要這麼做。

2023 年 2 月

新功能

更新

  • 內容篩選預設為開啟。

關於下列新文章:

新的訓練課程:

2023 年 1 月

新功能

  • 服務 GA。 Azure OpenAI 服務現已正式推出。

  • 新模型:新增最新文字模型、text-davinci-003(美國東部、西歐)、text-ada-embeddings-002(美國東部、美國中南部、西歐)

2022 年 12 月

新功能

  • OpenAI 的最新模型。 Azure OpenAI 可讓您存取所有最新的模型,包括 GPT-3.5 系列。

  • 新的 API 版本 (2022-12-01)。 此更新包含數個要求的增強功能,包括 API 回應中的令牌使用資訊、檔案的改善錯誤訊息、在微調建立數據結構上與 OpenAI 一致,以及後置詞參數的支援,以允許自定義微調作業的命名。 ​

  • 每秒要求數上限較高。 非 Davinci 模型的 50 個。 20 適用於達文奇模型。

  • 更快速地微調部署。 在 10 分鐘內部署 Ada 和 Curie 微調的模型。

  • 較高的訓練限制: Ada、Babbage 和 Curie 的 40M 訓練令牌。 達文奇為 10M。

  • 要求修改濫用和誤用數據記錄和人工檢閱的程式。 目前,服務會記錄要求/響應數據,以便進行濫用和誤用偵測,以確保不會濫用這些強大的模型。 不過,許多客戶都有嚴格的數據隱私權和安全性需求,需要更充分掌控其數據。 為了支持這些使用案例,我們會發行新的程式,讓客戶修改內容篩選原則,或關閉低風險使用案例的濫用記錄。 此程式遵循 Azure AI 服務內已建立的有限存取程式,而 現有的 OpenAI 客戶可以在這裡套用。

  • 客戶管理的金鑰 (CMK) 加密。 CMK 藉由提供用於儲存定型數據和自定義模型的加密密鑰,讓客戶更充分地控制在 Azure OpenAI 中管理其數據。 客戶自控金鑰 (CMK) 也稱為自備金鑰 (BYOK),可提供更大的彈性來建立、輪替、停用及撤銷存取控制。 您也可稽核用來保護資料的加密金鑰。 請從待用加密檔深入瞭解。

  • 加密箱支援

  • SOC-2 合規性

  • 透過 Azure 資源健康狀態、成本分析和計量和診斷設定進行記錄和診斷。

  • Studio 改善。 Studio 工作流程的許多可用性改善,包括 Azure AD 角色支援,可控制小組中誰可以存取建立微調的模型和部署。

變更(中斷)

微調建立 API 要求已更新,以符合 OpenAI 的架構。

預覽 API 版本:

{​
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",​
    "hyperparams": { ​
        "batch_size": 4,​
        "learning_rate_multiplier": 0.1,​
        "n_epochs": 4,​
        "prompt_loss_weight": 0.1,​
    }​
}

API 版本 2022-12-01:

{​
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",​
    "batch_size": 4,​
    "learning_rate_multiplier": 0.1,​
    "n_epochs": 4,​
    "prompt_loss_weight": 0.1,​
}

內容篩選預設會暫時關閉 。 Azure con 帳篷模式 ration 的運作方式與 Azure OpenAI 不同。 Azure OpenAI 會在產生呼叫期間執行內容篩選,以偵測有害或濫用的內容,並從響應中進行篩選。 瞭解更多資訊

這些模型將在 2023 年第 1 季重新啟用,且預設為開啟。 ​

客戶動作

下一步

深入了解驅動 Azure OpenAI 的基礎模型