您可以通過承諾保留 Azure AI Foundry 模型的布建輸送量單位 (PTU) 使用量一個月或一年,來節省 Azure AI Foundry 布建輸送量的成本。 本文說明如何使用 Azure AI Foundry 布建的輸送量保留來節省成本。
若要購買 Azure AI Foundry 準備的輸送量保留,您可以選擇 Azure 區域、數量和您想涵蓋的部署類型。 然後將 Azure AI Foundry 的預配置輸送量 SKU(全球、資料區或區域性)新增至您的購物車。 然後確認您要購買的 Azure AI Foundry 配給傳輸量單位數量,並完成您的訂單。
當您購買預訂時,符合預訂屬性的 Azure AI Foundry 預配輸送量使用量不會再以每小時費率收費。
備註
全域、數據區和區域部署的保留無法交換。 您必須為每個部署類型購買個別的保留。 例如,如果您購買全域保留,權益只會套用至全域部署,不適用於數據區或區域。
您可以以特定限制交換或取消全域、數據區和區域部署的保留。 如需詳細資訊,請參閱 Azure 預約的自助交換和退款。
保留應用程式
預約僅適用於已設定的部署,且不包含其他服務項目,例如標準部署或微調。 Azure AI Foundry 備妥的輸送量保留也同樣無法保證容量的可用性。 為了確保容量可用性,建議的最佳做法是先建立部署,再購買保留。
當保留期限屆滿時,Azure AI Foundry 準備的通量部署仍然會持續運行,但將以每小時費率計費。
續約選項
您可以選擇在續約設定或購買時選取選項,以啟用保留的自動續約。 使用 Azure AI Foundry 布建的輸送量保留自動續約,保留會使用相同的保留訂單標識碼更新,而且不會購買新的保留。 您也可以選擇在更新設定中,將此預約替換為新的預約訂購,而當原預約到期時會進行替換的購買。 根據預設,取代保留的屬性與過期保留相同,但預設會設定為自動續約。 您可以選擇在續訂設定中變更名稱、帳單週期、期限或數量。 擁有預訂的擁有者存取權以及用於計費的訂用帳戶的任何使用者,都可以設定續訂。 當預訂設定為相同訂單 ID 的自動續約時,該預訂會持續自動續約,直到您選擇將其關閉為止。 購買時,如果您選擇開啟自動續約,1 個月期限的預約將會在相同的訂單 ID 上自動續約,而 1 年期限則需要購買新的預約替代。
先決條件
您可以在 Azure 入口網站中購買 Azure AI Foundry 專用吞吐量保留。 保留的付款方式可為預先付款或每月付款。 若要購買保留:
- 您必須在 Azure 訂用帳戶上具備擁有者角色或保留購買者角色。
- 針對企業訂用帳戶,必須在 Azure 入口網站 (部分內容可能是機器或 AI 翻譯) 中啟用 [保留執行個體] 原則選項。 如果該設定已停用,則您必須是 EA 系統管理員才能將其啟用。
- Direct Enterprise 客戶可以在 Azure 入口網站中更新 [保留執行個體] 原則設定。 瀏覽至 [原則] 功能表以變更設定。
- 針對雲端解決方案提供者(CSP)計劃,只有系統管理代理或銷售專員可以購買 Azure AI Foundry 預配置的輸送量保留。
如需了解企業客戶和隨用隨付客戶在預訂購買時的計費方式,請參閱 瞭解企業註冊的 Azure 預訂使用量 和 瞭解隨用隨付訂用帳戶的 Azure 預訂使用量。
購買前選擇正確的大小和部署類型
Azure AI Foundry 所布建的輸送量保留大小應根據您透過 Azure AI Foundry 模型中的模型部署所耗用的總布建輸送量單位來確定。 保留購買會以一個佈建的輸送量單位增量進行。
例如,假設您已部署 100 個單位的布建區域部署類型,以及 50 個布建的全域部署類型。 在此範例中,您應該購買 100 個單位的已布建管理區域保留,並購買 50 個單位的已布建管理全域保留,以涵蓋所有已部署的 PTU。
謹慎
模型部署的容量可用性是動態的,且在不同區域和模型間常會有變更。 若要防止購買的 PTU 數量超過您可以使用的數量,請先建立部署。 然後購買保留,以涵蓋您已部署的 PTU。 此最佳做法可確保您將保留折扣最大化,並有助於防止您購買無法完全使用的期間承諾用量。
購買 Microsoft Azure AI Foundry 提供的輸送量預留額度
當您購買預訂時,會使用目前的 UTC 日期和時間來記錄交易。
若要購買 Azure AI Foundry 預配置的吞吐量保留,請遵循下列步驟:
- 登入 Azure 入口網站。
- 選取所有服務>預約,然後選取Azure AI Foundry 配置輸送量
- 選取訂閱。 使用 [訂用帳戶] 清單來選擇用於支付保留的訂用帳戶。 會向訂用帳戶的付款方式收取保留的費用。 訂用帳戶類型必須是 Enterprise 合約 (供應項目號碼:MS-AZR-0017P 或 MS-AZR-0148P)、Microsoft 客戶合約或隨用隨付 (供應項目號碼:MS-AZR-0003P 或 MS-AZR-0023P)。
- 對於企業訂用帳戶,費用會從註冊的 Azure 預付款(先前稱為預付金)餘額中扣除,或收取超額費用。
- 針對隨用隨付訂用帳戶,費用是透過訂用帳戶的信用卡或發票付款方式收取。
- 選取範圍。 使用 [範圍] 清單來選擇訂用帳戶範圍。 您可以在購買後變更保留範圍。
- 單一資源群組範圍 - 只會將保留折扣套用至所選資源群組中的相符資源。
- 單一訂用帳戶範圍 - 會將保留折扣套用至所選訂用帳戶中的相符資源。
-
共用範圍 - 會將保留折扣套用至計費內容中合格訂用帳戶的相符資源。 如果訂用帳戶已移至不同的計費內容,則權益不再套用至訂用帳戶。 其會繼續套用至計費內容中的其他訂用帳戶。
- 針對企業客戶,計費的背景是 EA 加入計畫。 保留共用範圍會在註冊中包括多個 Microsoft Entra 租用戶。
- 針對 Microsoft 客戶合約客戶,計費範圍是帳單設定檔。
- 針對隨用隨付客戶,共用範圍是帳戶管理員所建立的全部隨用隨付訂閱。
- 管理群組 - 將保留折扣套用至管理群組和計費範圍所包含的訂用帳戶清單中的相符資源。 管理群組範圍適用於整個管理群組階層中的所有訂用帳戶。 若要為管理群組購買保留,您至少需有管理群組的讀取權限,且必須是計費訂用帳戶的保留擁有者或保留購買者。
- 選取區域以選擇保留涵蓋的 Azure 區域。
- 選取產品以涵蓋您的部署類型(全域、數據區或地區),然後選取 [ 新增至購物車]。
- 在購物車中,選擇您想要購買的布建輸送量單位數量。 例如,每小時最多 64 個已部署的布建輸送量單位數量會涵蓋 64 個。
- 選取 [下一步:檢閱 + 購買],並檢閱您的購買選項及其價格。
- 選取 [立即購買]。
- 購買之後,您可以選取 [檢視此保留] 以查看您的購買狀態。
取消、更改或退款預訂
您可以使用特定限制來交換或取消保留。 如需詳細資訊,請參閱 Azure 預約的自助交換和退款。
如果您想要交換 Azure AI Foundry 預設輸送量保留,您可以遵循下列步驟來執行此動作:
- 登入 Azure 入口網站,然後移至 [保留] 頁面。
- 選取您想要退款的 Azure AI Foundry 設定的輸送量保留,然後選取 Exchange。
- 選取要購買的新保留。
- 檢閱條款及條件,並同意條款。
如果您想要申請 Azure AI Foundry 預配置吞吐量保留的退款,您可以遵循下列步驟來進行:
- 登入 Azure 入口網站,然後移至 [保留] 頁面。
- 請選擇您希望退款的 Azure AI Foundry 已佈建輸送量保留,然後選擇「傳回」。
- 在 [退款保留] 頁面上,檢閱退款金額,然後選取 [退回原因]。
- 選取 [退回保留執行個體]。
- 檢閱條款及條件,並同意條款。
退款金額是以按比例計算的剩餘期限和保留的目前價格為基礎。 退款金額會套用為 Azure 帳戶的點數。
要求退款之後,保留會取消,您可以在 Azure 入口網站的 [保留] 頁面上檢視您的退款要求狀態。
在 12 個月的滾動期間內,您的計費範圍 (例如 EA、Microsoft 客戶合約和 Microsoft 合作夥伴合約) 中所有已取消的保留承諾用量總數不可超過 50,000 美元。
如何將預訂折扣套用至 Azure AI Foundry 提供的模型
購買 Azure AI Foundry 布建輸送量的保留之後,與保留相關聯的折扣會自動套用至部署在 Azure AI Foundry 模型所指定區域中可用模型的任何單位,只要這些單位落在保留範圍內即可。 保留折扣會套用至佈建的輸送量隨用隨付計量所發出的使用量。
備註
全域、數據區和區域部署的保留無法交換。 您必須為每個部署類型購買個別的保留。
預訂折扣申請
Azure AI Foundry 布建輸送量保留的應用程式是以 Azure AI Foundry 模型中可用模型的保留和已部署 PTU 之間的每小時比較為基礎。 已部署的 PTU 總和與保留數量(up-to)相符合的部分會透過保留支付(已支付),而任何超過保留的 PTU 部分,則會以每小時隨用隨付的費率收取費用。 有其他幾點要記住:
- 部分小時部署的 PTU 會根據部署在一小時內存在的分鐘數來按比例計算。 例如,一小時期間內只存在 15 分鐘的 100 個 PTU 部署會被視為 25 個 PTU 部署。 具體而言,15 分鐘是一小時的 1/4,因此在該小時內,僅有 1/4 的已部署 PTU 會被考慮用於計費和預約應用。
- 在套用保留之前,部署會根據保留範圍比對保留。 例如,限定為單一訂用帳戶的保留範圍只涵蓋該訂用帳戶內的部署。 其他訂用帳戶中的部署會以每小時隨用隨付率收費,除非其他訂用帳戶涵蓋這些訂用帳戶的範圍。
保留價格假設保留的 PTU 全天候部署。 在部署的 PTU 比保留的 PTU 少的期間,保留會涵蓋所有已部署的 PTU,但不會使用多餘的保留 PTU。 這些多餘的保留 PTU 會遺失,且不會延續到其他期間。
備註
Azure AI Foundry 布建輸送量保留的應用程式適用於 Azure AI Foundry 模型中可用的模型(例如 Azure OpenAI 服務、DeepSeek 等)如需 Azure AI Foundry 模型的清單,請參閱 Azure AI Foundry 模型定價頁面。
折扣範例
下列範例顯示 Azure AI Foundry 預留的吞吐量折扣的套用方式,視部署而定。
範例 1 - 與區域部署單位大小完全相同的區域保留。 例如,您會在區域保留區上購買 100 個 PTU,並部署 100 個區域 PTU。 在此範例中,您只需支付保留價格。
範例 2 - 大於全域部署單位的全域保留。 例如,您會在全域保留區上購買 300 個 PTU,而您只部署 100 個全域 PTU。 在此範例中,全域保留折扣會套用至 100 個全域 PTU。 其餘 200 個 PTU,在全球保留中將會未使用,而且不會繼續在未來的計費期間。
範例 3 - 小於數據區部署單位的數據區域保留。 例如,您會在數據區保留區上購買 200 個 PTU,並部署 600 個數據區 PTU。 在此範例中,數據區保留折扣會套用至所使用的 200 個數據區 PTU。 其餘 400 個數據區 PTU 會以隨用隨付率收費。
範例 4 - 區域保留大小與兩個區域部署總計相同。 例如,您會在保留區上購買 200 個區域 PTU,且每個區域 100 個 PTU 有兩個部署。 在此範例中,折扣會套用至已部署單位的總和。
增加 Azure AI Foundry 設定的流量預留
您無法變更已購買的保留大小。 如果您想要增加 Azure AI Foundry 布建輸送量保留容量,以涵蓋更多每小時的 PTU,您可以購買更多 Azure AI Foundry 布建輸送量保留,或使用所需的數量交換現有的保留。
每月攤銷成本
您的分攤保留成本是以每個日曆月份為基礎。 因此,根據每年的每個月,您的每日攤銷成本可能會變更。 以下範例說明您每月攤銷成本的差異:
範例 1 - 如果您購買 1 月 10 日保留,續約如下所示:
- 第 1 個月:1 月 10 日 - 2 月 9 日(含)
- 第 2 個月:2 月 10 日 - 3 月 9 日(含)等
範例 2 - 如果您在 12 月 29 日、30 或 31 日購買保留,則更新日期會在一年內變更。 例如,假設您在 12 月 30 日購買保留。
- 第 1 個月:12 月 30 日 - 1 月 29 日 (含)
- 月 2:1 月 30 日 - 2 月 27 日 (含) - 非闰年
- 第3個月:2月28日 - 3月27日(含),依故
如果您的每月保留費用為 $200,且:
- 保留是在 5 月購買的,然後您每天看到攤銷成本 $200/31。
- 保留是在 2 月購買的,然後您會看到每日攤銷成本 $200/28。
相關內容
- 若要深入了解 Azure 保留項目,請參閱下列文章: