Azure Kubernetes Service (AKS) でのアプリケーションのスケーリングオプション

2025-06-11

Azure Kubernetes Service (AKS) でアプリケーションを実行する場合は、クラスター内のコンピューティングリソースの量を積極的に増減することが必要になる場合があります。アプリケーションインスタンスの数を変更する際に、基になる Kubernetes ノードの数を変更することが必要になる場合があります。また、多数の他のアプリケーションインスタンスをプロビジョニングする必要がある場合もあります。

この記事では、ポッドまたはノードの手動スケーリング、ポッドの水平オートスケーラの使用、クラスターオートスケーラーの使用、Azure Container Instances (ACI) との統合など、AKS アプリケーションでのスケーリングの主要な概念について説明します。

ポッドまたはノードを手動でスケーリングする

レプリカ、つまり、ポッドとノードを手動でスケーリングし、使用可能なリソースと状態の変化に対するアプリケーションの対応をテストできます。リソースを手動でスケーリングすると、固定コストを維持するために使用するリソースのセット量 (ノード数など) を定義できます。手動でスケーリングするには、レプリカまたはノード数を定義します。その後、Kubernetes API は、そのレプリカまたはノード数に基づいて、より多くのポッドの作成またはノードのドレインをスケジュールします。

ノードをスケールダウンすると、Kubernetes API は、クラスターで使用されるコンピューティングの種類に関連付けられている関連する Azure Compute API を呼び出します。たとえば、仮想マシンスケールセット上に構築されたクラスターの場合、削除するノードは仮想マシンスケールセット API によって決定されます。スケールダウン時に削除対象のノードがどのように選択されるかの詳細については、「Virtual Machine Scale Sets の FAQ」を参照してください。

ノードの手動スケーリングを始めるには、AKS クラスターでのノードの手動スケーリングに関する記事をご覧ください。ポッドの数の手動スケーリングについては、kubectl scale コマンドに関するページをご覧ください。

ポッドの水平オートスケーラー

Kubernetes は、ポッドの水平オートスケーラー (HPA) を使用して、リソース需要を監視し、ポッドの数を自動的にスケーリングします。既定では、HPA はレプリカ数の必要な変更についてメトリック API を 15 秒ごとにチェックしますが、Metrics API は 60 秒ごとに Kubelet からデータを取得します。その結果、HPA は 60 秒ごとに更新されます。変更が必要な場合は、それに応じてレプリカの数がスケーリングされます。 HPA は、Kubernetes バージョン 1.8 以降の Metrics Server をデプロイした AKS クラスターと連携します。

Kubernetes のポッドの水平オートスケーリング

所定のデプロイ用に HPA を構成する場合、実行できるレプリカの最小値と最大数を定義します。また、CPU 使用率など、監視およびスケーリングの決定に基づくメトリックも定義します。

AKS でポッドの水平オートスケーラーを開始するには、「ポッドを自動スケールする」を参照してください。

スケーリングイベントのクールダウン

HPA は 60 秒ごとに効果的に更新されるため、別のチェックが行われる前に、以前のスケールイベントが正常に完了しなかった可能性があります。この動作のため、前のスケーリングイベントでアプリケーションのワークロードとリソースの需要を受け取ってそれに応じて調整できるようになる前に、HPA によってレプリカの数が変更される可能性があります。

競合イベントを最小限に抑えるために、遅延値が設定されます。この値は、HPA がスケーリングイベント後に別のスケーリングイベントをトリガーできるまで待機する必要のある時間を定義します。この動作により、新しいレプリカ数が有効になり、メトリックの API で配分されたワークロードを反映できるようになります。 Kubernetes 1.12 の時点では、スケールアップイベントに遅延はありません。ただし、スケールダウンイベントの既定の遅延は 5 分です。

クラスターオートスケーラー

ポッドの需要の変化に対応するために、Kubernetes クラスターオートスケーラーは、ノードプール内で要求されるコンピューティングリソースに基づいてノードの数を調整します。既定では、クラスターオートスケーラーは、必要なノード数の変更についてメトリック API サーバーを 10 秒ごとに確認します。クラスターオートスケーラーで変更が必要だと判断されると、それに応じて AKS クラスター内のノードの数が増減されます。クラスターオートスケーラーは、Kubernetes 1.10.x 以降を実行する Kubernetes RBAC 対応 AKS クラスターで動作します。

Kubernetes クラスターオートスケーラー

クラスターオートスケーラーは通常、ポッドの水平オートスケーラーと一緒に使用されます。組み合わせると、水平ポッドオートスケーラーでは、アプリケーションの需要に基づいてポッドの数が増減し、クラスターオートスケーラーによって、追加のポッドを実行するためにノードの数が調整されます。

AKS でクラスターオートスケーラーを開始するには、「Azure Kubernetes Service のクラスターオートスケーラー (AKS) - プレビュー」を参照してください。

スケールアウトイベント

ノードに、要求されたポッドを実行するために十分なコンピューティングリソースがない場合、そのポッドではスケジューリングプロセスを進めることができません。ノードプール内で使用可能なコンピューティングリソースが増えない限り、ポッドを起動できません。

ノードプールのリソース制約のためにスケジュール設定できないポッドが、クラスターオートスケーラーによって検出されると、追加のコンピューティングリソースを提供するため、ノードプール内のノードの数が増やされます。ノードが正常にデプロイされ、ノードプール内で使用できるようになると、それらで実行するようにポッドがスケジュールされます。

アプリケーションを迅速にスケーリングする必要がある場合、一部のポッドは、クラスターオートスケーラーによってデプロイされたより多くのノードがスケジュールされたポッドを受け入れるまで、スケジュールされるのを待っている状態のままになることがあります。高いバースト需要のあるアプリケーションの場合、仮想ノードと Azure Container Instances でスケーリングできます。

スケールインイベント

クラスターオートスケーラーでは、最近新しいスケジュール要求を受け取っていないノードのポッドスケジューリング状態も監視されます。このシナリオでは、ノードプールに必要以上のコンピューティングリソースがあり、ノードの数を削減できることが示されます。 10分間不要であるというしきい値を超えたノードは、既定では削除がスケジュールされます。このような状況が発生した場合、ポッドは、ノードプール内の他のノードで実行するようにスケジュール設定され、クラスターオートスケーラーは、ノードの数を減らします。

あなたのクラスター自動スケーラーがノードの数を減らしたときに、ポッドは別のノード上にスケジュール設定されるので、アプリケーションに何らかの中断が発生する場合があります。中断を最小限に抑えるには、単一のポッドインスタンスを使用するアプリケーションを使用しないでください。

Kubernetes イベント駆動型自動スケーリング (KEDA)

Kubernetes Event-driven Autoscaling (KEDA) は、ワークロードのイベントドリブン自動スケーリング用のオープンソースコンポーネントです。受け取ったイベントの数に基づいてワークロードを動的にスケーリングします。 KEDA は、ScaledObject と呼ばれるカスタムリソース定義 (CRD) を使用して、特定のトラフィックに応じてどのようにアプリケーションをスケーリングするかを記述するよう Kubernetes を拡張します。

KEDA スケーリングは、ワークロードでトラフィックのバーストが発生したり、大量のデータを処理したりするシナリオで役立ちます。 KEDA はイベントドリブンであり、イベントの数に基づいてスケーリングされるのに対し、HPA はリソース使用率 (CPU やメモリなど) に基づいてメトリックに基づくため、KEDA はポッドの水平オートスケーラーとは異なります。

AKS で KEDA アドオンの使用を開始するには、KEDA の概要に関する記事を参照してください。

ノードの自動プロビジョニング

ノード自動プロビジョニング (プレビュー) (NAP) では、AKS クラスターで Karpenter を自動的にデプロイ、構成、管理するオープンソースの Karpenter プロジェクトが使用されます。 NAP は、保留中のポッドリソース要件に基づいてノードを動的にプロビジョニングします。リアルタイムの需要を満たすために、最適な仮想マシン (VM) SKU と数量が自動的に選択されます。

NAP は、保留中のワークロードに最適な SKU を決定するための開始点として、定義済みの VM SKU の一覧を取得します。より正確な制御のために、ユーザーはノードプールで使用されるリソースの上限と、複数のノードプールがある場合にワークロードをスケジュールする必要がある場所の基本設定を定義できます。

Azure Container Instances (ACI) へのバースト

AKS クラスターを迅速にスケーリングするために、Azure Container Instances (ACI) と統合できます。 Kubernetes には、レプリカおよびノード数をスケーリングするコンポーネントが組み込まれています。ただし、アプリケーションを迅速にスケーリングする必要がある場合は、ポッドの水平オートスケーラーによって、ノードプール内の既存のコンピューティングリソースでサポートできるよりも多くのポッドがスケジュールされる可能性があります。このシナリオを構成すると、クラスターオートスケーラーがノードプールにさらに多くのノードをデプロイするようにトリガーされますが、それらのノードが正常にプロビジョニングされ、Kubernetes スケジューラでポッドが実行されるまでに数分かかる場合があります。

ACI への Kubernetes バーストスケーリング

ACI を使うと、インフラストラクチャのオーバーヘッドを増やすことなく、コンテナーインスタンスを迅速にデプロイできます。 AKS で接続する場合、ACI は、AKS クラスターのセキュリティ保護された論理拡張機能になります。仮想ノードコンポーネントは仮想 Kubelet に基づいており、仮想 Kubernetes ノードとして ACI を提示する AKS クラスターにインストールされます。 Kubernetes は続いて、直接 AKS クラスター内にある VM ノード上のポッドとしてではなく、仮想ノードを通じた ACI インスタンスとして実行するポッドをスケジュール設定できます。

アプリケーションは、仮想ノードを使用するために変更は不要です。クラスターオートスケーラーが AKS クラスター内に新しいノードをデプロイするときに、デプロイは AKS と ACI にわたって遅延なくスケーリングできます。

仮想ノードは、AKS クラスターと同じ仮想ネットワーク内の別のサブネットにデプロイされます。この仮想ネットワーク構成は、ACI と AKS 間のトラフィックをセキュリティで保護します。 AKS クラスターと同様に、ACI インスタンスは、他のユーザーから分離されたセキュリティ保護された論理的なコンピューティングリソースです。

次のステップ

アプリケーションのスケーリングを始めるには、次のリソースを参照してください。

ポッドまたはノードを手動でスケーリングする
ポッドの水平オートスケーラーを使用する
クラスターオートスケーラーを使用する
Kubernetes Event-driven Autoscaling (KEDA) アドオンを使用する

Kubernetes と AKS の中心概念の詳細については、次の記事を参照してください。

次の方法で共有

Azure Kubernetes Service (AKS) でのアプリケーションのスケーリング オプション

ポッドまたはノードを手動でスケーリングする

ポッドの水平オートスケーラー

スケーリング イベントのクールダウン

クラスター オートスケーラー

スケールアウト イベント

スケールイン イベント