什麼是 Azure OpenAI 服務?
Azure OpenAI 服務提供 REST API 存取 OpenAI 的強大語言模型,包括 o1-preview、o1-mini、GPT-4o、GPT-4o mini、GPT-4 Turbo with Vision、GPT-4、GPT-3.5-Turbo 和 Embeddings 模型系列。 這些模型可以輕鬆地適應您的特定工作,包括但不限於內容產生、摘要、影像理解、語意搜尋,以及將自然語言翻譯為程式碼。 用戶可以透過 REST API、Python SDK 或在 Azure AI Studio 中存取服務。
功能概觀
功能 | Azure OpenAI |
---|---|
可用的模型 | o1-preview & o1-mini - (有限存取 - 要求存取) GPT-4o + GPT-4o 迷你 GPT-4 系列 (包括包含視覺功能的 GPT-4 Turbo) GPT-3.5-Turbo 系列 內嵌系列 若要深入了解,請參閱我們的模型頁面。 |
微調 | GPT-4o-mini (預覽)GPT-4 (預覽)GPT-3.5-Turbo (0613)babbage-002 davinci-002 . |
價格 | 請參閱這裡 如需包含視覺功能的 GPT-4 Turbo 的詳細資料,請參閱特殊價格資訊。 |
虛擬網路支援與私人連結支援 | 是。 |
受控識別 | 是,透過 Microsoft Entra ID |
UI 體驗 | Azure 入口網站,適用於帳戶與資源管理, 適用於模型探索和微調的 Azure AI Studio |
建立區域可用性模型 | 模型可用性 |
內容篩選 | 使用自動化系統,根據我們的內容原則評估提示和完成。 篩選高嚴重性內容。 |
負責 AI
Microsoft 承諾 AI 的進展,由以人為先的原則所驅動。 Azure OpenAI 中可用的生產力模型具有顯著的潛在優點,但是若沒有仔細設計和謹慎的緩和措施,這類模型可能會產生不正確或甚至是有害的內容。 Microsoft 已進行大量投資,以協助防範濫用和非預期的損害,其包括納入 Microsoft 負責任 AI 使用的原則、採用使用服務的管理辦法、建置內容篩選以支援客戶,並提供客戶在使用 Azure OpenAI 時應考量的負責任 AI 資訊和指導。
開始使用 Azure OpenAI 服務
若要開始使用 Azure OpenAI 服務,您必須在 Azure 訂用帳戶中建立 Azure OpenAI 服務資源。
從 建立及部署 Azure OpenAI 服務資源 指南開始。
您可以透過 Azure 入口網站、Azure CLI 或 Azure PowerShell 來建立資源。
當您有 Azure OpenAI 服務資源時,您可以部署 GPT-4o 等模型。
當您有已部署的模型時,您可以:
- 試用 Azure AI Studio 遊樂場,以探索模型的功能。
- 您也可以使用 REST API 或 SDK 開始對服務進行 API 呼叫。
注意
需要有限存取註冊窗體,才能存取某些 Azure OpenAI 服務模型或功能。 若要深入瞭解,請參閱 Azure OpenAI 有限存取權頁面。
比較 Azure OpenAI 和 OpenAI
Azure OpenAI 服務可為客戶提供具有 OpenAI GPT-4、GPT-3、Codex 及 DALL-E、Whisper 和文字轉換語音模型的進階語言 AI,並享有 Azure 的安全性和企業承諾。 Azure OpenAI 會使用 OpenAI 共同開發 API,以確保相容性,並且能夠兩個 API 之間順暢轉換。
透過 Azure OpenAI,客戶可享有 Microsoft Azure 的安全性功能,同時執行與 OpenAI 相同的模型。 Azure OpenAI 提供私人網路、區域可用性,以及負責任 AI 內容篩選。
重要概念
提示與完成
完成端點是 API 服務的核心元件。 此 API 可提供存取模型的文字輸入、輸出介面。 使用者只要提供包含英文文字命令的輸入提示,模型就會產生完成文字。
以下是簡單的提示和完成範例:
提示:
""" count to 5 in a for loop """
完成:
for i in range(1, 6): print(i)
語彙基元
文字權杖
Azure OpenAI 會藉由將文字分解成語彙基元來處理文字。 語彙基元可以是字組或字元區塊。 例如,“hamburger” 一詞會分成 “ham”、“bur” 和 “ger” 的語彙基元,而 “pear” 之類的簡短常用字組則是單一語彙基元。 許多語彙基元都會以空白字元開頭,例如 “ hello” 和 “ bye”。
指定要求中處理的令牌總數取決於您的輸入、輸出和要求參數長度。 正在處理的語彙基元數量也會影響模型的回應延遲和輸送量。
映像令牌
使用 GPT-4o、GPT-4o 迷你和 GPT-4 Turbo 搭配視覺模型的 Azure OpenAI 影像處理功能,會使用影像令牌化來判斷影像輸入所使用的令牌總數。 取用的令牌數目是根據兩個主要因素來計算:影像詳細數據層級(低或高)和影像的維度。 以下是如何計算令牌成本:
- 低解析度模式
- 低詳細數據可讓 API 針對不需要高影像解析度分析的案例,傳回更快的回應。 針對低詳細數據影像所取用的令牌如下:
- GPT-4o 和 GPT-4 Turbo with Vision:不論大小為何,每個影像的一般速率為 85 個令牌。
- GPT-4o 迷你:不論大小為何,每個映像的一般速率為 2833 個令牌。
- 範例:4096 x 8192 影像(低詳細數據):成本是具有 GPT-4o 的固定 85 令牌,因為它是低詳細數據影像,而且大小不會影響此模式的成本。
- 低詳細數據可讓 API 針對不需要高影像解析度分析的案例,傳回更快的回應。 針對低詳細數據影像所取用的令牌如下:
- 高解析度模式
- 高詳細數據可讓 API 更詳細地分析影像。 影像令牌會根據影像的維度來計算。 計算牽涉到下列步驟:
- 影像重設大小:影像會重設大小以符合 2048 x 2048 像素平方。 如果最短的一邊大於 768 像素,影像會進一步重設大小,讓最短的一邊長 768 圖元。 重設大小期間會保留外觀比例。
- 磚計算:重設大小后,影像會分成 512 x 512 像素磚。 任何部分磚會四捨五入為完整磚。 磚數目會決定令牌總成本。
- 權杖計算:
- GPT-4o 和 GPT-4 Turbo with Vision:每張 512 x 512 像素磚的成本 為 170 個令牌。 額外的 85個基底令牌 會新增至總計。
- GPT-4o 迷你:每個 512 x 512 像素磚成本 5667 令牌。 額外的 2833個基底令牌 會新增至總計。
- 範例:2048 x 4096 影像(高詳細數據):
- 影像一開始會重設大小為 1024 x 2048 像素,以符合 2048 x 2048 像素平方。
- 影像會進一步調整為 768 x 1536 像素,以確保最短的一側長度上限為 768 圖元。
- 影像分成 2 x 3 磚,每張 512 x 512 圖元。
- 最終計算:
- 對於 GPT-4o 和 GPT-4 Turbo with Vision,令牌總成本是每個磚 6 個磚 x 170 個令牌 + 85 個基底令牌 = 1105 個令牌。
- 針對 GPT-4o 迷你版,令牌總成本是每個磚 6 個磚 x 5667 令牌 + 2833 基底令牌 = 36835 令牌。
- 高詳細數據可讓 API 更詳細地分析影像。 影像令牌會根據影像的維度來計算。 計算牽涉到下列步驟:
資源
Azure OpenAI 服務是 Azure 上的新產品供應項目。 您可以使用與任何其他 Azure 產品一樣的方式來開始使用 Azure OpenAI ,一樣可以在 Azure 訂用帳戶中建立資源或服務的執行個體。 您可以深入了解 Azure 的資源管理設計。
部署
建立 Azure OpenAI 資源之後,您必須先部署模型,才能開始進行 API 呼叫並產生文字。 您可以使用部署 API 來完成此動作。 這些 API 可讓您指定要使用的模型。
提示工程
來自 OpenAI 的 GPT-3、GPT-3.5 和 GPT-4 模型是以提示為基礎。 使用提示型模型時,使用者要輸入文字提示來與模型進行互動,而模型會使用文字完成對文字提示進行回應。 此完成是模型的輸入文字接續。
雖然這些模型很強大,但他們的行為也會對提示很敏感。 這可讓提示工程成為開發的重要技能。
提示建構可能很困難。 在實務上,提示用來設定模型權數以完成所需的工作,但它比較是藝術而不是科學,通常需要體驗和直覺來製作成功的提示。
模型
此服務可讓使用者存取數個不同的模型。 每個模型都提供不同的功能和價格點。
DALL-E 模型 (部分處於預覽狀態;請參閱模型) 會從使用者提供的文字提示產生影像。
Whisper 模型可用來將語音轉譯和翻譯為文字。
文字轉換語音模型 (目前為預覽版) 可用於合成文字轉換語音。
深入了解模型概念頁面上的每個模型。