Service Fabric クラスターの容量計画に関する考慮事項

[アーティクル]
06/01/2023

クラスターの容量計画は、どの Service Fabric 運用環境にとっても重要です。主な考慮事項は次のとおりです。

クラスターのノードタイプに関する初期の数とプロパティ
Azure インフラストラクチャ内での Service Fabric の VM の権限を決定する、各ノードタイプの持続性レベル
クラスターの信頼性レベル。これにより、Service Fabric システムサービスとクラスター機能全体の安定性が決まります

この記事では、これらの各領域について、重要な意思決定のポイントを順次説明します。

クラスターのノードタイプに関する初期の数とプロパティ

ノードタイプにより、クラスター内の一連のノード (仮想マシン) のサイズ、数、およびプロパティが定義されます。 Service Fabric クラスターで定義されているすべてのノードタイプは、仮想マシンスケールセットにマップされます。

各ノードタイプは異なるスケールセットであるため、個別にスケールアップまたはスケールダウン可能で、異なるポートのセットを開いたり、異なる容量メトリックを設けたりすることができます。ノードタイプと仮想マシンスケールセットの間の関係について詳しくは、Service Fabric クラスターのノードタイプに関するページを参照してください。

各クラスターには、Service Fabric プラットフォームの機能を提供する重要なシステムサービスを実行する、プライマリノードタイプが 1 つ必要です。アプリケーションを実行するためにプライマリノードタイプを使用することもできますが、このタイプはシステムサービスの実行専用にすることが推奨されます。

非プライマリノードタイプを使用すると、アプリケーションロール ("フロントエンド" サービスや "バックエンド" サービスなど) を定義し、クラスター内でサービスを物理的に分離することができます。 Service Fabric クラスターには、0 個以上の非プライマリノードタイプを作成できます。

プライマリノードタイプは、Azure Resource Manager のデプロイテンプレートで、ノードタイプの定義の下にある isPrimary 属性を使用して構成されます。ノードタイプのプロパティの完全な一覧については、「NodeTypeDescription オブジェクト」を参照してください。使用例については、Service Fabric クラスターサンプルでいずれかの AzureDeploy.json ファイルを開き、 [ページ内の検索] で nodeTypes オブジェクトを検索します。

ノードタイプの計画に関する考慮事項

ノードタイプの初期数は、クラスターの目的と、そのクラスターで実行されるアプリケーションとサービスによって異なります。次の質問について考えてみましょう。

アプリケーションに複数のサービスがあるか、また、そのいずれかを一般に公開したりインターネットに接続したりする必要があるか。

典型的なアプリケーションには、クライアントからの入力を受信する 1 つのフロントエンドゲートウェイサービスと、そのフロントエンドサービスと通信する 1 つ以上のバックエンドサービスが含まれていて、フロントエンドサービスとバックエンドサービスの間に別個のネットワークが存在します。このような場合には、一般に、1 つのプライマリノードタイプと、2 つの非プライマリノードタイプ (フロントエンドサービス用とバックエンドサービス用にそれぞれ 1 つ) という 3 つのノードタイプが必要です。
アプリケーションを構成するサービスに、インフラストラクチャに関して異なるニーズがあるか (より多くの RAM が必要、より高速な CPU サイクルが必要など)。

フロントエンドサービスは、多くの場合、インターネットに対してポートを開いた、より小さな VM (D2 のようなサイズの VM) で実行できます。計算負荷が高いバックエンドサービスは、インターネットには接続していない、より大きな VM (D4、D6、D15 のようなサイズの VM) で実行する必要がある場合があります。これらのサービスに対して異なるノードタイプを定義すると、基になっている Service Fabric VM をより効率的かつ安全に使用することができ、それらを個別にスケーリングできるようになります。必要になるリソースの量を見積もることの詳細については、「Service Fabric アプリケーションの容量計画」を参照してください
いずれかのアプリケーションサービスを、100 ノードを超えてスケールアウトする必要が生じるか。

1 つのノードタイプでは、Service Fabric アプリケーションの仮想マシンスケールセット 1 つあたり 100 ノードを超えて、信頼性高くスケーリングすることができません。 100 を超えるノードを実行するには、追加の仮想マシンスケールセット (したがって追加のノードタイプ) が必要です。
クラスターが複数の Availability Zones にまたがることになるか。

Service Fabric では、特定のゾーンに固定されるノードタイプをデプロイすることによって、Availability Zones にまたがるクラスターをサポートし、アプリケーションの高可用性を確保します。 Availability Zones には追加のノードタイプの計画が必要で、最小要件を満たす必要があります。詳しくは、Availability Zones をまたがる Azure Service Fabric クラスターのプライマリノードのタイプのトポロジに関する記事をご覧ください。

クラスターの最初の作成でノードタイプの数とプロパティを決定するときには、いったんクラスターをデプロイすれば、(プライマリ以外の) ノードタイプをいつでも追加、変更、または削除できることを念頭に置いてください。実行中のクラスターでも、プライマリノードタイプはスケールアップまたはスケールダウンできます。ただし、そのためには、新しいノードタイプを作成し、ワークロードを移動してから、元のプライマリノードタイプを削除する必要があります。

ノードタイプのプロパティに関するその他の考慮事項は、持続性レベルです。これにより、Azure インフラストラクチャ内でノードタイプの VM が持つ権限が決まります。次に説明するように、クラスターのために選択した VM のサイズと、個々のノードタイプに割り当てたインスタンス数を参考にすると、ノードタイプごとに適切な耐久性レベルを決定する助けになります。

クラスターの持続性の特徴

持続性レベルによって、Service Fabric VM が、基になる Azure インフラストラクチャで持つ権限を指定します。この権限によって、Service Fabric は、Service Fabric のシステムサービスやステートフルサービスのクォーラム要件に影響を与える VM レベルのインフラストラクチャ要求 (再起動、再イメージ化、移行など) を一時停止できます。

重要

持続性レベルは、ノードタイプごとに設定されます。何も指定されていない場合、Bronze レベルが使用されます。本稼働のワークロードでは、VM レベルインフラストラクチャの要求でデータ損失を回避するため、Silver か Gold の持続性レベルが必要になります。

次の表に、Service Fabric の耐久性サービスレベル、それらの要件、提供される内容を示します。

耐久性レベル	必要な VM の最小数	サポートされる VM サイズ	仮想マシンスケールセットに対して行う更新	Azure によって開始される更新プログラムとメンテナンス
ゴールド	5	単一の顧客専用のフルノードサイズ - 使用可能な VM サイズ	Service Fabric クラスターに承認されるまで延期可能	アップグレードドメインあたり 2 時間一時停止し、レプリカに以前のエラーから復旧するための追加の時間を提供可能
シルバー	5	1 つ以上のコアと少なくとも 50 GB のローカル SSD を搭載した VM	Service Fabric クラスターに承認されるまで延期可能	長時間の延期は不可
ブロンズ	1	少なくとも 50 GB のローカル SSD を搭載した VM	Service Fabric クラスターにより延期されることはない	長時間の延期は不可

Note

上記の VM の最小数は、各持続性レベルに必要な要件となります。 Microsoft では、これらの要件を満たしていない既存の仮想マシンスケールセットが作成または変更されないよう、検証を実施しています。

警告

ブロンズ持続性を使用する場合、OS イメージの自動アップグレードは使用できません。パッチオーケストレーションアプリケーション (Azure 以外でホストされているクラスターのみが対象) は、Silver 以上の持続性レベルでは推奨されませんが、Service Fabric アップグレードドメインに関しては、Windows 更新プログラムを自動化する唯一のオプションです。

重要

持続性レベルを問わず、仮想マシンスケールセットに対して割り当て解除操作を実行すると、クラスターが破棄されます。

ブロンズ

ブロンズの持続性で実行されているノードタイプは、権限を取得しません。つまり、ステートレスワークロードに影響をするインフラストラクチャジョブが停止されたり延期されたりすることはありません。ブロンズの持続性は、ステートレスワークロードだけを実行するノードタイプに対して使用します。運用環境のワークロードの場合は、Silver 以上が実行されていることをお勧めします。

Silver と Gold

Silver または Gold の持続性は、頻繁なスケールイン (VM インスタンス数の削減) が予想されるステートフルサービスをホストするすべてのノードタイプに対して使用します。また、プロセスの簡略化を重視してデプロイ操作の延期や容量の縮小が必要な場合に使用します。スケールアウトのシナリオは、耐久性サービスレベルの選択には影響しません。

長所

スケールイン操作に必要な手順の数が減少します (ノードの非アクティブ化と Remove-ServiceFabricNodeState が自動的に呼び出されます)。
インプレースの VM サイズ変更操作や Azure インフラストラクチャ操作によるデータ損失のリスクが軽減されます。

短所

仮想マシンスケールセットやその他の関連する Azure リソースへのデプロイが、タイムアウトになったり遅れたりする可能性があり、クラスター内やインフラストラクチャレベルの問題によって完全にブロックされる可能性があります。
Azure インフラストラクチャの操作中に自動化されたノードの非アクティブ化によりレプリカライフサイクルイベント (プライマリスワップなど) の数が増えます。
Azure プラットフォームソフトウェアまたはハードウェアメンテナンスアクティビティが発生している期間中は、ノードの稼働を停止します。これらのアクティビティの最中は、ノードのステータスが [無効化中] や [無効] と表示されます。これにより、一時的にクラスターの容量が削減されますが、クラスターまたはアプリケーションの可用性に影響はありません。

ノードタイプの持続性が Silver と Gold の場合のベストプラクティス

以下の推奨事項に従って、持続性が Silver または Gold であるノードタイプを管理します。

クラスターとアプリケーションを常に正常な状態に維持し、アプリケーションが適切なタイミングですべてのサービスレプリカのライフサイクルイベント (ビルドのレプリカが停止するなど) に応答することを確認します。
VM サイズの変更 (スケールアップ/ダウン) を行うためには、より安全な方法を採用します。仮想マシンスケールセットの VM サイズを変更する場合は、慎重な計画と注意が必要とされます。詳細については、Service Fabric ノードタイプのスケールアップに関するページを参照してください
持続性レベルが Gold または Silver である任意の仮想マシンスケールセットのノードを最小数である 5 つ保持します。このしきい値を超えてスケールインした場合には、クラスターがエラー状態になり、削除されたノードの状態 (Remove-ServiceFabricNodeState) を手動でクリーンアップする必要があります。
持続性レベルが Silver または Gold の各仮想マシンスケールセットは、Service Fabric クラスター内の独自のノードタイプにマップする必要があります。複数の仮想マシンスケールセットを 1 つのノードタイプにマッピングすると、Service Fabric クラスターと Azure インフラストラクチャ間の連携が正常に動作しなくなります。
VM インスタンスをランダムに削除せず、仮想マシンスケールセットのスケールイン機能を常に使用してください。ランダムな VM インスタンスを削除すると、アップグレードドメインと障害ドメインにわたって散在する VM インスタンスで不均衡が生じる可能性があります。この不均衡は、サービスインスタンス/サービスレプリカ間で適切に負荷分散を行うシステムの機能に悪影響を及ぼす場合があります。
自動スケーリングを使用する場合は、スケールイン (VM インスタンスの削除) 操作が一度に 1 ノードでのみ実行されるようにルールを設定します。一度に複数のインスタンスをスケールインすることは安全ではありません。
プライマリノードタイプで VM の削除または割り当て解除を行う場合は、割り当てられる VM の数を、その信頼性レベルで必要な数未満まで減らさないようにします。これらの操作は、持続性レベルが Silver または Gold のスケールセットでは無期限にブロックされます。

持続性レベルの変更

一定の制約のもとでは、ノードタイプの持続性レベルを調整できます。

持続性レベルが Silver または Gold のノードタイプは、ブロンズにダウングレードできません。
持続性レベルが Gold のノードタイプを Silver にダウングレードすることはサポートされていません。
ブロンズからシルバーまたはゴールドにアップグレードすると、数時間がかかる場合があります。
持続性レベルを変更する場合は、必ず、仮想マシンスケールセットリソースの Service Fabric 拡張機能の構成と、Service Fabric クラスターリソースのノードタイプ定義の両方で、レベルを更新してください。これらの値は一致している必要があります。

容量計画時の別の考慮事項は、クラスターの信頼性レベルです。次のセクションで説明するように、これによって、システムサービスとクラスター全体の安定性が決まります。

クラスターの信頼性の特徴

クラスターの信頼性レベルにより、クラスターのプライマリノードタイプで実行されるシステムサービスレプリカの数が決定されます。レプリカが増えるほど、システムサービス (したがって全体としてのクラスター) の信頼性が高まります。

重要

信頼性レベルはクラスターレベルで設定され、プライマリノードタイプのノードの最小数を決定します。運用環境のワークロードには、Silver (5 ノード以上) またはそれより上の信頼性レベルが必要です。

信頼性レベルは、以下のプランから選ぶことができます。

Platinum - システムサービスは、9 個のレプリカセット数をターゲットにして実行されます
Gold - システムサービスは、7 個のレプリカセット数をターゲットにして実行されます
Silver - システムサービスは、5 個のレプリカセット数をターゲットにして実行されます
ブロンズ - システムサービスは、3 個のレプリカセット数をターゲットにして実行されます

以下に、信頼性レベルを選択するときの推奨事項を示します。シードノードの数も、信頼性レベルのノードの最小数に設定されます。

[Number of nodes](ノードの数)	信頼性レベル
1	"`reliabilityLevel` パラメータを指定しないでください。これはシステムによって計算されます。"
3	ブロンズ
5 または 6	シルバー
7 または 8	ゴールド
9 以上	Platinum

クラスターのサイズ (すべてのノードタイプの VM インスタンスの総数) を増減するときには、クラスターの信頼性のレベルを別のレベルに更新することを検討してください。クラスターの信頼性レベルを変更すると、システムサービスのレプリカセット数を変更するために必要なクラスターのアップグレードが開始されます。ノードの追加など、クラスターにさらに変更を行う場合は、このアップグレードが完了してからにしてください。アップグレードの進行状況を監視するには、Service Fabric Explorer を使用するか、Get-ServiceFabricClusterUpgrade を実行します。

信頼性に関する容量計画

クラスターの容量ニーズは、具体的なワークロードと信頼性の要件によって決まります。このセクションでは、容量計画を始めるのに役立つ一般的なガイダンスを提供します。

仮想マシンのサイズ設定

運用環境のワークロードの場合、推奨される VM サイズ (SKU) は、50 GB 以上のローカル SSD、2 コア、および 4 GiB のメモリを持つ Standard D2_V2 (または同等のもの) です。推奨されるのは少なくとも 50 GB のローカル SSD ですが、一部のワークロード (Windows コンテナーを実行するものなど) には、より大容量のディスクが必要です。

既定では、ローカル SSD は 64 GB に構成されています。このサイズは、クラスター設定の [診断] セクションの MaxDiskQuotaInMB 設定で構成することができます。

Azure でホストされているクラスターの設定を調整する方法については、Azure のクラスター構成のアップグレードに関する記事を参照してください

Windows でホストされているスタンドアロンクラスターのクラスター設定を調整する方法については、「スタンドアロンクラスターの構成をアップグレードする」を参照してください

運用環境のワークロード用にその他の VM サイズを選択する場合は、以下の制約に留意してください。

Standard A0 のような、部分的/シングルコアの VM サイズはサポートされていません。
"A シリーズ" VM サイズは、パフォーマンス上の理由でサポートされていません。
優先度の低い VM はサポートされていません。
B シリーズのバースト可能 SKU はサポートされていません。

プライマリノードタイプ

Azure の運用環境ワークロードには、少なくとも 5 つのプライマリノード (VM インスタンス) と、Silver の信頼性レベルが必要です。クラスターのプライマリノードタイプをシステムサービス専用にし、配置制約を利用してアプリケーションをセカンダリノードタイプにデプロイすることをお勧めします。

Azure のテストワークロードでは、少なくとも 1 つまたは 3 つのプライマリノードを実行できます。 1 つのノードクラスターを構成するには、Resource Manager テンプレートで reliabilityLevel 設定が省略されていることを確認してください (reliabilityLevel に空の文字列値を指定しても十分ではありません)。 Azure portal で 1 つのノードクラスター設定を行った場合、この構成は自動的に行われます。

警告

1 ノードクラスターは信頼性のない特別な構成で実行され、スケールアウトはサポートされません。

非プライマリノードタイプ

非プライマリノードタイプのノードの最小数は、ノードタイプの実際の持続性レベルによって異なります。ノードの数 (と持続性レベル) は、そのノードタイプに対して実行するアプリケーションやサービスのレプリカの数に基づいて、ワークロードがステートフルであるかステートレスであるかに応じて計画する必要があります。クラスターをデプロイした後で、いつでも各ノードタイプの VM の数を増減できることを覚えておいてください。

ステートフルワークロード

Service Fabric のリライアブルコレクションまたはリライアブルアクターを使用するステートフルな運用環境ワークロードの場合は、レプリカの最小数とターゲット数を 5 にすることをお勧めします。こうすることで、安定状態では、各障害ドメインとアップグレードドメインに (1 つのレプリカセットから) 1 つのレプリカが配置されることになります。一般に、ステートフルサービス用に使用するレプリカ数の基準としては、システムサービスに設定する信頼性レベルを使用します。

ステートレスワークロード

ステートレスな運用環境ワークロードの場合、クォーラムを維持するためにサポートされる最小限の非プライマリノードタイプサイズは 3 です。ただし、ノードタイプサイズは 5 にすることが推奨されます。

次のステップ

後でクラスターを再作成する必要を軽減するために、クラスターの構成前に Not Allowed のクラスターアップグレードポリシーを確認します。再作成しないとシステム構成設定は変更できないためです。

クラスターの計画の詳細については、以下を参照してください。

次の方法で共有

Service Fabric クラスターの容量計画に関する考慮事項

クラスターのノードタイプに関する初期の数とプロパティ

ノードタイプの計画に関する考慮事項

クラスターの持続性の特徴

ブロンズ

Silver と Gold

長所

短所

ノードタイプの持続性が Silver と Gold の場合のベストプラクティス

持続性レベルの変更

クラスターの信頼性の特徴

信頼性に関する容量計画

仮想マシンのサイズ設定

プライマリノードタイプ

非プライマリノードタイプ

ステートフルワークロード

ステートレスワークロード

次のステップ

フィードバック

フィードバック

その他のリソース

次の方法で共有

Service Fabric クラスターの容量計画に関する考慮事項

クラスターのノード タイプに関する初期の数とプロパティ

ノード タイプの計画に関する考慮事項

クラスターの持続性の特徴

ブロンズ

Silver と Gold

長所

短所

ノード タイプの持続性が Silver と Gold の場合のベストプラクティス

持続性レベルの変更

クラスターの信頼性の特徴

信頼性に関する容量計画

仮想マシンのサイズ設定

プライマリ ノード タイプ

非プライマリ ノード タイプ

ステートフル ワークロード

ステートレス ワークロード

次のステップ

フィードバック

フィードバック

その他のリソース

クラスターのノードタイプに関する初期の数とプロパティ

ノードタイプの計画に関する考慮事項

ノードタイプの持続性が Silver と Gold の場合のベストプラクティス

プライマリノードタイプ

非プライマリノードタイプ

ステートフルワークロード

ステートレスワークロード