Application Gateway v2 と WAF v2 のスケーリング

Application Gateway と WAF は、2 つのモードでスケーリングするように構成できます。

  • 自動スケーリング - 自動スケーリングを有効にすると、Application Gateway と WAF v2 SKU は、アプリケーションのトラフィック要件に基づいて、スケールアウトまたはスケールインします。 このモードでは、アプリケーションに対して優れた柔軟性が提供され、アプリケーション ゲートウェイのサイズまたはインスタンスの数を推測する必要がなくなります。 また、このモードでは、予想される最大トラフィック負荷に対するピーク時のプロビジョニング容量でゲートウェイを実行する必要がないので、コストを節約することもできます。 最小のインスタンス数と、必要に応じて最大のインスタンス数を、指定する必要があります。 最小容量により、トラフィックがない場合であっても、Application Gateway と WAF v2 が、指定された最小インスタンス数を下回らないことが保証されます。 各インスタンスは 10 の追加予約容量ユニットに大体等しくなります。 0 は予約容量なしを意味し、事実上、純粋な自動スケールが行われます。 また、必要に応じて最大インスタンス数を指定することができ、これにより、Application Gateway が指定したインスタンスを超えてスケーリングしないことが保証されます。 Gateway によって処理されるトラフィックの量に対してのみ課金されます。 インスタンス数の範囲は 0 から 125 です。 最大インスタンス数を指定しない場合の既定値は 10 です。
  • 手動 - ゲートウェイが自動的にスケーリングされない手動モードを選択することもできます。 このモードでは、Application Gateway または WAF で処理できる量をトラフィックが超えた場合、トラフィックが失われる可能性があります。 手動モードでは、インスタンス数の指定が必須です。 指定できるインスタンスの数は 1 から 125 までです。

自動スケーリングと高可用性

Azure Application Gateways は常に可用性が高くなるようにデプロイされます。 このサービスは、構成に基づいて作成されるか (自動スケーリングが無効になっている場合)、アプリケーションの負荷によって必要になることから作成される (自動スケーリングが有効になっている場合) 複数のインスタンスから行われます。 ユーザーの観点からは、個々のインスタンスは必ずしも表示されず、全体としての Application Gateway サービスだけが表示されることにご留意ください。 特定のインスタンスに問題があり、機能しなくなった場合、Azure Application Gateway によって新しいインスタンスが透過的に作成されます。

最小インスタンス数のゼロで自動スケーリングを構成した場合でも、サービスの可用性が高く、それは常に固定価格に含まれます。

ただし、新しいインスタンスの作成には時間がかかります (約 6、7 分)。 このダウンタイムを許容できない場合は、最小インスタンス数の 2 を構成できます。可用性ゾーン サポートを利用することが理想です。 この方法では、通常の状況で、Azure Application Gateway 内にインスタンスが少なくとも 2 つ与えられます。 そのため、いずれかに問題が発生した場合、新しいインスタンスが作成される間、他方によってトラフィックの処理が試みられます。 1 つの Azure Application Gateway インスタンスで約 10 の容量ユニットをサポートできるため、一般的に与えられるトラフィックの量によっては、自動スケーリング設定の最小インスタンスを 2 より上の値に構成することがあります。

スケールイン イベントの場合、Application Gateway は、削除の対象となるインスタンス上で既存の接続を 5 分間ドレインします。 5 分後に、既存の接続が閉じられ、インスタンスが削除されます。 5 分間のスケールイン時間以降の新しい接続は、同じゲートウェイ上の他の既存のインスタンスに対して確立されます。

次のステップ