次の方法で共有


Azure OpenAI プロビジョニング 2024 年 8 月の更新プログラム

2024 年 8 月中旬、Microsoft はプロビジョニング スループット オファリングの改善を開始しました。これは、使いやすさと運用の機敏性に関するお客様からのフィードバックに対応するもので、新たな支払いオプションとデプロイ シナリオを開くものです。

この記事は、既存のプロビジョニング スループット オファリング ユーザーを対象としています。 新規のお客様は、Azure OpenAI プロビジョニングのオンボーディング ガイドについての記事を参照してください。

変更点

次の機能は、プロビジョニング済みマネージド オファリングに対してロールアウトされています。

重要

この記事の変更は、以前の "Provisioned Classic (PTU-C)" オファリングには適用されません。 これらは、プロビジョニング済み (プロビジョニング済みマネージドとも呼ばれます) オファリングにのみ影響します。

操作性の向上

機能 長所
モデルに依存しないクォータ すべてのモデル/バージョンをカバーする単一のクォータ制限により、クォータ管理が軽減され、新しいモデルでの実験が高速化されます。
セルフサービス クォータ要求 営業チームの関与なく、クォータの引き上げを要求します。多くは自動承認されます。
多くのリージョンにおいて、既定でプロビジョニング済みのマネージド クォータ 最初にクォータを要求することなく、すばやく開始できます。
リアルタイムな使用可能容量に関する透過的な情報 + 新しいデプロイ フロー 可用性に関するネゴシエーションが削減でき、市場投入までの時間が短縮されます。

新しい時間単位/予約の商用モデル

機能 長所
時間単位のコミットされていない使用 コミットメントする必要のない時間単位の支払いオプションを使用すると、短期間でのデプロイ シナリオが可能になります。
Azure Reservations を使用した期間割引 Azure Reservations では、1 か月と 1 年間の期間の場合、時間制より大幅な割引が提供されます。また、柔軟なスコープを提供することで、現在のリソースに縛られたコミットメントに関連する管理作業を最小限に抑えます。
多くのリージョンにおいて、既定でプロビジョニング済みのマネージド クォータ 最初にクォータを要求することなく、新しいリージョンですばやく作業を開始できます。
既にプロビジョニング済みのお客様に対する柔軟な支払いモデルの選択 コミットメントを持つお客様は、少なくとも 2024 年末までコミットメント モデルを維持できます。また、セルフサービスまたはマネージドプロセスにより、既存のコミットメントを時間単位/予約に移行することもできます。
最新のモデル世代をサポート 2024 年 8 月 1 日以降にリリースされたモデルをデプロイするには、時間単位/予約モデルが必要です。

操作性向上の詳細

プロビジョニング済みのクォータの細分性は、モデル固有からモデルに依存しないレベルに変化しています。 サブスクリプションとリージョン内の各モデルとバージョンが独自のクォータ制限を持つのではなく、サブスクリプションとリージョンごとに単一のクォータ項目があり、サポートされているすべてのモデルとバージョンにデプロイできる PTU の合計数が制限されます。

モデルに依存しないクォータ

2024 年 8 月 12 日から、既存のお客様の現在のモデル固有のクォータが、モデルに依存しないクォータに変換されました。 これは自動的に行われます。 切り替えに伴い、クォータが失われることはありません。 既存のクォータ制限が合計され、新しいモデルに依存しないクォータ項目に割り当てられます。

クォータの統合を示す図。

新しいモデルに依存しないクォータは、プロビジョニング済みのマネージド スループット ユニットという名前のクォータ項目として表示され、モデルとバージョンは名前に含まれません。 [Studio Quota] (スタジオ クォータ) ウィンドウで、クォータ項目を展開しても、クォータ項目に関係するすべてのデプロイが表示されます。

既定のクォータ

新規および既存のサブスクリプションには、多くのリージョンでわずかなプロビジョニング済みクォータが割り当てられます。 これにより、お客様は最初にクォータを要求することなく、これらのリージョンの使用を開始できます。

既存のお客様でリージョンに既にクォータの割り当てが含まれている場合、そのリージョンのクォータ制限は変更されません。 この場合、自動的に新しい規定の金額が増えるわけではありません。

セルフサービス クォータ要求

お客様は販売チームに問い合わせてクォータを取得できなくなりました。 代わりに、セルフサービス クォータ要求フォームを使用し、PTU マネージド クォータの種類を指定します。 フォームには、クォータ項目の右側のリンクからアクセスできます。 目標は、2 営業日以内にすべてのクォータ要求に応答することです。

次のクォータのスクリーンショットは、さまざまな種類のデプロイで使用されているモデルに依存しないクォータと、追加のクォータを要求するためのリンクを示しています。

より多くのクォータを要求するための、プロビジョニング済み Azure OpenAI の新しい要求の種類 UI のスクリーンショット。

制限としてのクォータ

8 月の更新プログラム以前、プロビジョニング済み Azure OpenAI は少数のお客様のみが利用でき、デプロイして使用する機能を最大限に活用するようクォータが割り当てられていました。 これらの変更により、すべてのユーザーに対してクォータを取得するプロセスが簡略化され、デプロイを試みた場合にサービス容量の制限が発生する可能性が高くなります。 新しい API とスタジオ エクスペリエンスを使用すると、サブスクリプションにクォータがあり、サービスが希望するモデルのデプロイをサポートする容量があるリージョンをユーザーが見つけられるようにします。

また、コミットメントを使用しているお客様は、コミットメントを作成または拡張する前にデプロイを作成することをお勧めします。 これにより、コミットメントを作成する前に容量を確保でき、コミットメントの過剰な購入の防止を保証します。 これをサポートするために、デプロイがコミットメントよりも大きく作成されることを防止していた制限が削除されました。 クォータ、使用可能な容量、コミットメントに対するこの新しいアプローチは、時間単位/予約モデルで提供されているものと一致し、コミットメント (または時間単位モデルの場合は予約) を購入する前にデプロイするガイダンスは両方で同じです。

詳細については、次のリンクをご覧ください。 予約とコミットメントのガイダンスは同じです。

新しい時間単位/予約の支払いモデル

Note

次の支払いモデルの説明は、以前の "Provisioned Classic (PTU-C)" オファリングには適用されません。 これらは、プロビジョニング済み (プロビジョニング済みマネージド) オファリングにのみ影響します。 Provisioned Classic は、変わらない毎月のコミットメント支払いモデルによって引き続き管理されます。

Microsoft は、プロビジョニング済みデプロイ用の新しい "時間単位/予約" 支払いモデルを導入しました。 これは、少なくとも 2024 年末まで継続してサポートされる現在のコミットメント支払いモデルに追加されます。

コミットメント支払モデル

  • プロビジョニング済み (契約上より長期に利用可能な期間) を使用するには、リージョンの月単位のコミットメントが必要です。

  • コミットメントは Azure OpenAI リソースにバインドされるため、リソース間でのデプロイの移動が困難になります。

  • コミットメントは、新しい PTU を追加する場合以外は、期間中に取り消す、または変更することはできません。

  • 2024 年 8 月 1 日より前にリリースされたモデルをサポートします。

時間単位の予約支払いモデル

  • 支払いモデルは、他の製品の Azure 標準に合わせて調整されています。

  • 時間単位の使用は、コミットメントなしでサポートされます。

  • 1 か月と 1 年間の期間割引は、リージョンの Azure Reservations として購入できます。

  • 予約は複数のサブスクリプションに対応するようにスコープを柔軟に設定できます。また、スコープは中期的に変更できます。

  • 古いモデルと新しいモデルの両方をサポートします。

重要

2024 年 8 月 1 日以降にリリースされたモデルでは、時間単位/予約支払いモデルを使用する必要があります。 アクティブなコミットメントを持つ Azure OpenAI リソースにはデプロイできません。 8 月 1 日以降にリリースされたモデルをデプロイする場合、既存のお客様は次のいずれかを行う必要があります。

  • コミットメントなしで Azure OpenAI リソースにデプロイを作成します。
  • 既存のリソースをコミットメントから移行します。

支払いモデル フレームワーク

時間単位または予約支払いモデルのリリースにより、支払いオプションの柔軟性が向上し、プロビジョニングの支払いに関するモデルが変更されました。 プロビジョニングを購入する唯一の方法が 1 か月のコミットメントであったときは、モデルは次のとおりでした。

  1. Microsoft アカウント チームから PTU クォータを取得します。
  2. デプロイを行うリソースへのコミットメントからクォータを "購入" します。
  3. コミットメントの制限に達するまで、リソースにデプロイを作成します。

このモデルと新しいモデルの主な違いは、以前はプロビジョニングに対する支払いの唯一の方法が 1 か月の期間割引だったことです。 現在は、選択すれば時間単位でデプロイしてデプロイ料金を支払うことができ、1 か月のコミットメント (以前と同様) または Azure 予約のいずれで割引を行うかについて、別個に決定できます。

この分析情報に基づいて、支払いモデルについての新しい考え方は次のようになります。

  1. セルフサービス フォームを使用して PTU クォータを取得します。
  2. クォータを使用してデプロイを作成します。
  3. 必要に応じて、コミットメントまたは予約を購入または延長して、デプロイに期間割引を適用します。

手順 1 と 2 は、すべての場合で同じです。 違いは、割引を提供する手段としてコミットメントと Azure 予約のどちらを使用するかです。 両方のモデルで次のようになります。

  • 割引対象よりも多くの PTU をデプロイできます。 (たとえば、割引を購入せずにデプロイすることで、新しいモデルを試すための短期的なデプロイの作成が可能になります)

  • 割引方法 (コミットメントまたは予約) は割引価格を固定数の PTU に適用し、どのデプロイが割引の対象としてカウントされるかを決めるスコープがあります。

    割引タイプ 使用可能なスコープ (リージョン内)
    コミットメント Azure OpenAI リソース
    行 2 リソース グループ、単一サブスクリプション、管理グループ (サブスクリプションのグループ)、共有 (課金アカウント内のすべてのサブスクリプション)
  • 割引価格は、割引での割引対象 PTU の数に達するまで、デプロイされた PTU に適用されます。

  • デプロイされた PTU の数が割引対象の PTU 数を超えた場合 (または、どの割引の対象にもならない場合)、1 時間あたりの料金が課金されます。

  • ベスト プラクティスは、最初にデプロイを作成してから、割引を適用することです。 これは、そのサービスを保証するためです。 容量は、使用できない PTU の期間コミットメントを作成する前に、デプロイをサポートするために使用できます。

Note

ベスト プラクティスに従うと、デプロイを作成してから割引 (コミットメントまたは予約) を引き上げるまでの時間単位の料金が発生する場合があります。

このため、デプロイの直後に割引を引き上げられるように準備することをお勧めします。 Azure 予約を購入するための前提条件は、コミットメントの場合とは異なります。デプロイの割引に使用する場合は、デプロイ前に検証することをお勧めします。 詳細については、「Azure の予約を表示および管理するためのアクセス許可」を参照してください

デプロイを割引方法にマッピングする

2024 年 8 月より前にプロビジョニングされた Azure OpenAI を使用しているお客様は、サブスクリプション内でいずれかの、または両方の支払いモデルを同時に使用できます。 各デプロイに使用される支払いモデルは、Azure OpenAI リソースに基づいて決定されます。

リソースにアクティブなコミットメントがある

  • コミットメントにより、リソースでのすべてのデプロイが、コミットメントの PTU の数まで割引されます。 超過した PTU は時間単位で課金されます。

リソースにアクティブなコミットメントがない

  • リソースの下でのデプロイは、Azure 予約によって割引を受けることができます。 これらのデプロイが割引の対象となるには、アクティブな予約のスコープ内に存在する必要があります。 予約のスコープ内のすべてのデプロイ (同じまたは他のサブスクリプション内の他のリソースへのデプロイを含む) は、予約の PTU の数までグループとして割引されます。 超過した PTU は時間単位で課金されます。

既存の支払いモードを変更する

現在コミットメントを持っているお客様は、少なくとも 2024 年末まで引き続き使用できます。 これには、新規または既存のコミットメントでの新しい PTU の購入や、コミットメントの更新動作の管理が含まれます。 ただし、8 月の更新プログラムでは、コミットメント操作の特定の側面が変更されました。

  • 2024 年 8 月 1 日以前にプロビジョニング済みとしてリリースされたモデルのみが、コミットメントを持つリソースにデプロイできます。

  • コミットメントの下でデプロイされた PTU が、コミットされた PTU を超えた場合、新しい時間単位/予約支払いモデルに使用されたものと同じ時間単位測定に対して時間単位の超過料金が発生します。 これにより、Azure Reservation を使用して超過料金を割引できます。

  • これは、リソースでコミットされた数よりも多くの PTU をデプロイできます。 これにより、容量をカバーするコミットメントのサイズを増やす前に、使用可能な容量を保証する機能がサポートされます。

既存のリソースをコミットメントから移行する

既存のお客様は、既存のリソースをコミットメントから時間単位/予約の支払いモデルに移行することで最新モデルの導入によるメリットを享受するか、または多様なデプロイに対する割引を単一の予約に統合するかを選択できます。

コミットメント モデルを使用したリソースを時間単位/予約モデルに移行するには、2 つのアプローチがあります。

セルフサービス移行

セルフサービス移行アプローチを使用すると、お客様はコミットメントを期限切れにすることで、そのコミットメントのリソースを有機的に解消できます。 リソースを移行するプロセスは次のとおりです。

  • 既存のコミットメントを自動更新しないように設定し、有効期限をメモします。

  • 有効期限が切れる前に、お客様はサブスクリプションあたりのコミット済み PTU の合計数をカバーする Azure Reservation を購入する必要があります。 既存の予約のスコープにサブスクリプションが既にある場合は、新しい PTU をカバーするようにサイズを増やすことができます。

  • コミットメントの有効期限が切れると、リソースの下のデプロイは、予約によって割引された使用量で時間単位/予約モードに自動的に切り替わります。

このセルフサービス移行アプローチでは、予約とコミットメントの両方がアクティブとなる重複が発生します。 これはこの移行モードの特性であり、この重複の予約またはコミットメント時間ではお客様にクレジットが戻されません。

セルフサービス移行のもう 1 つのアプローチは、コミットメントの有効期限が切れた後に予約購入に切り替える方法です。 この方法では、デプロイによって、コミットメントの有効期限と予約の購入の間の時間単位の使用量が発生します。 前のモデルと同様に、これはこのアプローチの特徴であり、この時間単位の使用量はクレジットされません。

セルフサービス移行の利点:

  • 個々のリソースは、異なる時間に移行できます。
  • お客様は、Microsoft に依存することなく移行を管理します。

セルフサービス移行の欠点:

  • コミットから時間単位/予約課金への切り替え中に、二重請求または時間単位の料金が短期間発生します。

重要

どちらのセルフサービス アプローチでも、支払いモードが [コミット済み] から [時間単位/予約] に切り替えられるため、追加料金が発生します。 これらは移行アプローチの特性であり、お客様はこれらの料金に対してクレジットされません。 お客様は、次で説明するマネージド移行アプローチを使用して、それらを回避することができます。

マネージド移行

マネージド移行アプローチでは、お客様が Microsoft と提携して、サブスクリプション/リージョン内のすべての PTU コミットメントを同時に一括移行する必要があります。 動作はこのようになります。

  1. お客様はアカウント チームと連携し、マネージド移行を要求します。 お客様の移行を支援するために、Microsoft チームの移行所有者が割り当てられます。
  2. 現在の PTU コミットメントを含む各顧客のサブスクリプションとリージョン内のすべてのリソースが、コミット済みから時間単位/予約課金モデルに移行される日付が選択されます。 複数のサブスクリプションとリージョンを同じ日付に移行できます。
  3. 合意日には、
    • お客様は、変換されるコミットされた PTU をカバーするリージョン予約を購入し、予約情報を Microsoft 移行連絡先に渡します。
    • 2 - 3 営業日以内に、すべてのコミットメントが事前に取り消され、以前のコミットメントの下でのデプロイでは、時間単位/予約支払いモデルの使用が開始されます。
    • 予約購入後の請求期間では、お客様は、予約購入時より、キャンセルされたコミットメントの部分をカバーする予約購入のクレジットを受け取ります。

お客様は、管理された移行をスケジュールするために、アカウント チームに連絡する必要があります。

マネージド移行の利点:

  • サブスクリプション/リージョン内のすべてのコミットメントの一括移行は、多くのコミットメントを持つお客様にとって有益です。
  • シームレスなコスト移行: 重複請求や追加の時間単位の料金が発生する可能性はありません。

マネージド移行の欠点:

  • サブスクリプション/リージョン内のすべてのコミットメントを同時に移行する必要があります。
  • 移行の時間を Microsoft チームと調整する必要があります。

プロビジョニング スループット コミットメントの管理

プロビジョニングされたスループット コミットメントは、Azure OpenAI Studio の [コミットメントの管理] メニューから作成および管理されます。 このビューに移動するには、[クォータ] メニューから [コミットメントの管理] を選択します。

通知を含むコミットメント購入の UI のスクリーンショット。

[コミットメントの管理] ビューでは、いくつかの操作を実行できます。

  • 新しいコミットメントを購入するか、既存のコミットメントを編集します。
  • サブスクリプション内のすべてのコミットメントを監視します。
  • 予期しない課金を引き起こす可能性のあるコミットメントを特定し、アクションを実行します。

以下のセクションでは、これらのタスクについて説明します。

プロビジョニング スループット コミットメントの購入

コミットメント計画の準備ができたら、次の手順はコミットメントを作成することです。 コミットメントは Azure OpenAI Studio を使って手動で作成します。コミットメントを作成するユーザーには、サブスクリプション レベルで共同作成者または Cognitive Services 共同作成者のロールが必要です。

作成する必要がある新しいコミットメントごとに、以下の手順を実行します。

  1. [クォータ]>[準備済み]>[コミットメントの管理] を選び、[プロビジョニング スループットの購入] ダイアログを起動します。

購入ダイアログのスクリーンショット。

  1. [コミットメントの購入] を選択します。

  2. Azure OpenAI リソースを選び、コミットメントを購入します。 リソースは、編集できるコミットメントが既に存在するリソースと、現在コミットメントがないリソースに分けられて表示されます。

設定 メモ
リソースの選択 プロビジョニングされたデプロイを作成するリソースを選びます。 コミットメントを購入すると、現在のコミットメントが期限切れになるまで、別のリソースで PTU を使用できなくなります。
コミットメント期間を選択します [プロビジョニング済み] を選択します。 (プロビジョニング済みは、プロビジョニング済みマネージドと同義です)
現在コミットされていないプロビジョニング済みクォータ このリソースにコミットするために現在使用できる PTU の数。
コミットする量 (PTU) コミットする PTU 数を選びます。 コミットメント期間中にこの数を増やすことができますが、減らすことはできません。 コミットメントタイプ "プロビジョニング済み" の場合、50 の増分で値を入力します。
現在の期間のコミットメント レベル コミットメント期間は 1 か月に設定されます。
更新設定 現在の PTU での自動更新
下位の PTU での自動更新
自動更新しない
  1. [購入] を選択します。 確認ダイアログが表示されます。 確認すると、PTU がコミットされ、それらを使ってプロビジョニングされたデプロイを作成できるようになります。 |

コミットメント購入の UI のスクリーンショット。

重要

新しいコミットメントは、期間全体に対して事前に課金されます。 更新の設定が自動更新に設定されている場合、更新日のたびに更新の設定に基づいて再度請求されます。

既存のプロビジョニング スループット コミットメントの編集

[コミットメントの管理] ビューから、既存のコミットメントを編集することもできます。 既存のコミットメントに対して行える変更には次の 2 つの種類があります。

  • コミットメントに PTU を追加できます。
  • 更新設定を変更できます。

コミットメントを編集するには、編集する現在のコミットメントを選択し、[コミットメントの編集] を選択します。

既存のコミットメントへのプロビジョニング スループット ユニットの追加

既存のコミットメントに PTU を追加すると、リソース内に多数のデプロイを作成できます。 コミットメントの期間中いつでもこれを行うことができます。

コミット値の量が増加したコミットメント購入の UI のスクリーンショット。

重要

コミットメントに PTU を追加すると、現在の日付から既存のコミットメント期間の終了日までの期間分に応じて即時請求されます。 PTU を追加しても、コミットメント期間はリセットされません。

更新設定の変更

コミットメントの更新設定は、コミットメントの有効期限前ならいつでも変更できます。 更新設定を変更する理由には、コミットメントを自動更新しないように設定してプロビジョニングされたスループットの使用を終了することや、次の期間にコミットされるPTU数を減らしてプロビジョニングされたスループットの使用量を減らすことなどがあります。

重要

コミットメントを期限切れにしてしまうか、リソースのコミットメントよりも多い PTU をリソースのデプロイが必要とするほどサイズを小さくしてしまった場合、余分な PTU に対して時間単位の超過料金が発生します。 たとえば、デプロイの合計が 500 PTU でコミットメントが 300 PTUのリソースの場合、200 PTU に対して時間単位の超過料金が発生します。

コミットメントを監視し、予期しない課金を防ぐ

[コミットメントの管理] ウィンドウには、特定の Azure サブスクリプション内のコミットメントと PTU 使用量を含むすべてのリソースのサブスクリプション全体の概要を表示されます。 特に重要な点は次のとおりです。

  • PTU Committed、Deployed、Usage – これらの数値は、コミットメントのサイズと、デプロイで使用されている量を示します。 コミットされたすべての PTU を使用して、投資を最大化します。
  • 有効期限ポリシーと日付 - 有効期限とポリシーは、コミットメントの期限が切れる時期と、その場合に発生することを示します。 自動更新するように設定されたコミットメントは、更新日に課金イベントを生成します。 期限切れのコミットメントの場合、期限切れ日より前にこれらのリソースからデプロイを削除して、時間単位の超過請求を防ぐ必要があります。コミットメントの現在の更新設定。
  • 通知 - 未使用のコミットメントや、課金超過を招く可能性のある構成など、重要な条件に関するアラート。 請求超過は、コミットメントの期限が切れ、デプロイがまだ存在しているが、時間単位の課金に移行したなどの状況で発生する可能性があります。

コミットメント管理の一般的なシナリオ

プロビジョニング スループットの使用を終了する

現在のコミットメントの期限切れ後にプロビジョニングされたスループットの使用を終了し、期限切れ後の時間超過料金を防ぐには、次の 2 つのステップが必要です。

  1. すべてのコミットメントの更新ポリシーを [自動更新しない] に設定します。
  2. クォータを使って、プロビジョニングされたデプロイを削除します。

コミットメントまたはデプロイを同じサブスクリプションまたはリージョン内の新しいリソースに移動する

Azure OpenAI Studio では、デプロイやコミットメントを新しいリソースに直接 "移動" することはできません。 代わりに、ターゲット リソース上に新しいデプロイを作成し、トラフィックをそこに移動する必要があります。 これを実現するには、新しいリソースに対して購入したコミットメントが必要です。 コミットメントは、30 日間分、前払いで課金されるため、新しいコミットメントとの重複と、重複期間中の "二重課金" を最小限に抑えるために、この移行のタイミングを元のコミットメントの期限切れに合わせる必要があります。

この移行を実装するには 2 つのアプローチがあります。

オプション 1: オーバーラップなしの切り替え

このオプションの場合、ある程度のダウンタイムが必要ですが、追加のクォータは必要なく、追加のコストも発生しません。

手順 メモ
既存のコミットメントの更新ポリシーを期限切れに設定します こうすることで、コミットメントの更新とさらなる課金を防ぐことができます
既存のコミットメントが期限切れになる前に、そのデプロイを削除します ダウンタイムはこの時点から始まり、新しいデプロイが作成され、トラフィックが移動されるまで続きます。 有効期限の日時にできるだけ近いタイミングで削除することで、この期間を最小限に抑えることができます。
既存のコミットメントが期限切れになったら、新しいリソースにコミットメントを作成します 有効期限が切れた後すぐにこの手順と以下の手順を実行して、ダウンタイムを最小限に抑えます。
新しいリソース上にデプロイを作成し、そこにトラフィックを移動します

オプション 2: 重複する切り替え

このオプションでは、既存のデプロイと新しいデプロイの両方が同時に稼働するため、ダウンタイムは発生しません。 これには、新しいデプロイを作成するために使用できるクォータが必要であり、重複するデプロイの期間中に追加のコストが発生します。

手順 メモ
既存のコミットメントの更新ポリシーを期限切れに設定します こうすることで、コミットメントの更新とさらなる課金を防ぐことができます。
既存のコミットメントの有効期限が切れる前:
1.新しいリソースにコミットメントを作成します。
2.新しいデプロイを作成します。
3.トラフィックを切り替えます
4.既存のデプロイを削除します
既存のコミットメントが期限切れになる前にすべての手順を完了できる十分な時間を確保してください。そうしないと、オプションに対して超過料金が発生します (次のセクションを参照してください)。

最後の手順に予想より時間がかかり、既存のコミットメントの期限が切れた後に完了する場合、超過料金を最小限に抑えるには 3 つのオプションがあります。

  • ダウンタイムを取る: 元のデプロイを削除して、移動を完了します。
  • 超過料金を支払う: トラフィックを移動してデプロイを削除するまで、元のデプロイを維持し、時間単位で支払います。
  • 元のコミットメントをリセットして、もう一度更新します。 こうすることで、既知のコストで移動を完了する時間が得られます。

元の有効期限を過ぎると、超過料金の支払いと元のコミットメントのリセットの両方で料金が発生します。 移動にかかる期間が 1 日から 2 日で済む場合は、超過料金を支払う方が、新しい 1 か月分のコミットメントよりも安くなる可能性があります。 両方のオプションのコストを比較して、最も低コストのアプローチを見つけてください。

デプロイを新しいリージョンまたはサブスクリプションに移動する

リージョン内でコミットメントとデプロイを移動する場合にも同じアプローチが適用されますが、あらゆる場合に新しい場所で使用できるクォータが必要になる点が異なります。

既存のリソースの表示と編集

Azure OpenAI Studio で、[クォータ]>[準備済み]>[コミットメントの管理] を選び、既存のコミットメントがあるリソースを選んで表示または変更します。