Azure VMware Solution ワークロードのインフラストラクチャとプロビジョニングに関する考慮事項

この記事では、基本レイヤーを参照するAzure VMware Solution オファリングのインフラストラクチャ設計領域について説明します。 このレイヤーは、VMware vSphere ワークロードを効率的かつ確実に実行するために必要なコンピューティング、ストレージ、ネットワーク機能をサポートします。 この記事では、回復性、セキュリティ、スケーラビリティ、自動化、ディザスター リカバリーのために VMware ソフトウェア定義データ センター (SDDC) スタックを使用する方法についても説明します。 VMware SDDC スタックには、次のものが含まれます。

  • VMware ESXi
  • VMware vCenter サーバー
  • VMware NSX-T データ センター
  • VMware vSAN
  • VMware HCX (省略可能)
  • VMware SRM (省略可能)

ビジネス ターゲットの計算

影響: 信頼性、パフォーマンス効率、オペレーショナル エクセレンス

Azure VMware Solution アプリケーションのサービス レベル アグリーメント (SLA) などの可用性ターゲットは、プラットフォームに対して定義する必要があります。

目標復旧時間 (RTO) などの復旧ターゲットを使用して、使用できないAzure VMware Solution時間を特定します。 復旧ポイント目標 (RPO) を使用して、障害発生時に許容されるデータ損失の量を特定します。

ソリューションを設計するときは、次の点を考慮してください。

  • クリティカル パスの依存関係。 ソリューションのすべてのコンポーネントが等しく重要なわけではありません。 システムを停止できる依存関係と、エクスペリエンスの低下につながる可能性がある依存関係を明確に区別します。 この設計では、障害の影響を最小限に抑えるために、重要なコンポーネントの回復性を強化する必要があります。

  • オンデマンドでのスケールアウトとスケールイン。 環境は、負荷に基づいて拡張および縮小できる必要があります。 自動化を通じてこれらの操作を処理します。 人間による一般的なエラーを回避するには、ユーザー入力を最小限に抑える必要があります。

Recommendations
  • プラットフォームに適した SLA を確立します。
  • RTO ターゲットと RPO ターゲットを定義します。
  • 回復性のある重要なコンポーネントを設計します。
  • スケールインとスケールアウトには自動化を使用します。

ワークロード リソースとスケール要件を検討する

影響: パフォーマンス効率、オペレーショナル エクセレンス

ワークロードをデプロイする前に、Azure VMware Solutionをサポートするために必要なコンポーネントについて一般的に理解しておく必要があります。 この理解を得るには、ワークロードの特性、リソース、スケール要件を慎重に検討する必要があります。 これらの要因によって、クラスターの全体的な設計が構成されます。 また、Azure VMware Solutionがインフラストラクチャのデプロイに適していることを確認します。 Azure のサービスとしてのインフラストラクチャ (IaaS) またはサービスとしてのプラットフォーム (PaaS) ソリューションへのワークロードの移行は、Azure VMware Solutionへの移行よりもコスト効率が高く、パフォーマンスが高いシナリオがあります。

Recommendations

厚いプロビジョニングとシン プロビジョニングを使用する

影響: パフォーマンス効率

SDDC でインフラストラクチャをプロビジョニングする場合、主な焦点は、仮想マシン (VM) の基になるコンピューティングとストレージであるホストです。 Azure VMware Solutionでは、VM の仮想ディスクのシン プロビジョニングまたはシック プロビジョニングのいずれかを選択できます。 選択する方法は、特定のストレージ要件、パフォーマンスに関する考慮事項、および予想される VM の増加によって異なります。 シン プロビジョニングでは、必要に応じてストレージを割り当てることで、ストレージの使用量を最適化します。 この方法では、未使用の領域が最小限に抑えられます。 これに対し、最初から、シック プロビジョニングでは、各 VM に割り当てて予約する記憶域の全容量が使用されます。

Recommendations
  • ストレージ効率が優先され、未使用のストレージ消費を最小限に抑える場合は、シン プロビジョニングを使用します。
  • アプリケーションで一貫性のある高パフォーマンスのストレージ アクセスが必要な場合は、シック プロビジョニングを検討してください。

容量とリソースの使用量を計画する

影響: パフォーマンス効率

Azure VMware Solutionにアプリケーションをデプロイする前に、適切なサイズ設定と容量計画を確実に行う必要があります。 具体的には、スケーラビリティ要件、拡張予測、パフォーマンスに関する考慮事項を検討してください。

Recommendations
  • Azure に移行する前に、 Azure Migrate を使用して、リソースの使用状況とサイズ設定に関する推奨事項に関する分析情報を取得します。
  • 特定の期間にわたるリソース使用率パターンを分析して、ベースラインの使用状況の確立、ピーク期間の特定、リソースの急増の予測に役立ちます。
  • クリティカル パス上のコンポーネントの概要を示す依存関係マップを作成します。 マップを積極的に維持し、ソリューションの変更のために定期的にチェックします。

リージョンの選択

影響: パフォーマンス効率、セキュリティ

ユーザーがソリューションの近くにあることを確認するには、選択するリージョンを慎重に検討してください。 ユーザーがピアリングの場所に物理的に近づくと、待機時間が最小限に抑え、要件を満たすのに役立ちます。 たとえば、VMware HCX を使用する場合、ラウンドトリップ待機時間は 150 ミリ秒未満である必要があるという要件があります。

また、リージョンの選択時に規制要件を検討することも重要です。 規制要件とデータ所在地の制限は、リージョンによって異なる場合があります。 Azure geo レプリケート ストレージを使用する場合は、ペアのリージョンを利用できます。 この概念では、各 Azure リージョンは同じ地域内の別のリージョンとペアになっています。 レプリケートされるデータは、税および法執行管轄の目的で、そのペアと同じ地域内に存在します。

Recommendations
  • 待機時間を最小限に抑えるために、ユーザーや他の Azure サービスに近いリージョンを選択します。
  • 業界または地域ベースの法令遵守のためのクラウド共有責任モデルについて理解します。
  • Azure データ サービスを使用するときに、データが正しい地政学的ゾーンに残っていることを確認します。

スケーラブルな設計を使用する

影響: 信頼性、パフォーマンス効率

アプリケーションのサイズを変更する場合は、ピーク時のパフォーマンスでワークロードを処理するように VM のサイズを変更します。 停止中に、アプリケーションは機能の低下やパフォーマンスの低下を伴って動作できる必要もあります。 障害イベントを準備するには、回復性を考慮して設計します。 リージョン、ゾーン、サービス、またはコンポーネントの障害が重要なアプリケーション機能に影響を与えた場合でも、障害に対応し、信頼性を提供するようにシステムを設計します。 垂直スケーリングは、VM が個々のホストにリソースを追加する機能です。 垂直方向のスケーリングでは、適切な SKU を選択し、ホストの電源を切り、それらのリソースを使用できる VMware ESXi ホストからリソースを追加する必要があります。

垂直スケーリングに関連するダウンタイムによってビジネスが中断される可能性があるため、ワークロード設計で水平方向のスケーリングを検討してください。 水平スケーリングは、複数の VM にまたがるワークロードを動的に拡張する機能です。 水平スケーリングには、通常、リソース割り当て設定、VM テンプレート、複製、動的リソース割り当て手法などの VMware vSphere 機能の使用が含まれます。 たとえば、3 つの個別の VM にトラフィックを分散する場合は、高可用性のためにそれらの VM を 3 つの個別のホストに配置します。

クラスタリングは、高度な管理機能と可用性機能を提供するために、ホストの論理グループを作成することに関係しています。 ホストをプロビジョニングしたら、Azure VMware Solution環境内に VMware vSphere クラスターを作成して構成し、VM を管理し、コンピューティング機能を提供できます。

Recommendations
  • Azure VMware Solution用のカスタム GitHub 自動スケーリング アドオンを使用して、クラスター ノードでのスケールインまたはスケールアウト操作に使用するパフォーマンス メトリックAzure VMware Solution定義します。

  • 配置ポリシーのアフィニティ ルールを使用して、リソースの可用性を確保します。 アフィニティ ルールを構成すると、管理者は VM の配置を制御できます。 その後、VM は、特定の要件、パフォーマンスに関する考慮事項、可用性のニーズ、またはライセンスの制約に従って配布できます。

高可用性を実装する

影響: 信頼性、パフォーマンス効率

Azure VMware Solution内に高可用性またはクラスタリングを備えた VM をデプロイする場合は、VM を分離して別々のホストに保持するアンチアフィニティ ルールを作成することをお勧めします。 ストレッチ クラスターは、主に障害ドメインまたは可用性ゾーン間でのリソース分散のコンピューティングに関連します。 考慮すべきもう 1 つの側面は、ワークロードへの接続の待機時間です。 一部のワークロードでは、待機時間の影響を受けません。

Recommendations
  • 高可用性を実現するためにストレッチ クラスターを使用します。
  • アプリケーション層、データベース層、およびストレージ層が同じ可用性ゾーンにあることを確認して、アプリケーション層とサービス層を併置します。
  • Azure VMware Solution クラスターをデプロイするための Azure リージョンを慎重に選択します。 ユーザーまたはその他のリソースへの近接性、ネットワーク接続オプション、待機時間の要件を考慮してください。

アフィニティ ルールを使用する

影響: 信頼性

1 つのホストで問題またはエラーが発生した場合、アフィニティ対策規則によって複数のホストに分散が適用されます。 このディストリビューションは、障害の影響を制限し、アプリケーションとサービスの可用性を維持するのに役立ちます。

Recommendations
  • VM 間で待機時間の短い通信パスが必要な場合は、配置ポリシーアフィニティ ルールを使用して、VM を同じホストに保持します。
  • アプリケーションをサポートする VM でフォールト トレランスが必要な場合、またはリソース分散を使用してホストのパフォーマンスを最適化する場合は、配置ポリシー VM と VM のアフィニティを使用します。
  • Azure VMware Solution内に高可用性またはクラスタリングを使用してデプロイされた VM の場合は、配置ポリシー VM-VM のアンチアフィニティ ルールを作成して、それらの VM を分離して別々のホストに保持します。

VMware vSAN をデプロイする

影響: 信頼性、パフォーマンス効率

ストレージを使用して適切に設計されたAzure VMware Solutionを設計するには、適切なデータ保護と冗長性を計画する必要があります。

Azure VMware Solution仮想記憶域ネットワーク (vSAN) は、Azure VMware Solution クラスター内の VMware ESXi ホストからのローカル ストレージ リソースを使用して、分散共有ストレージ インフラストラクチャを作成します。 vSAN プロビジョニングは、現在および将来のストレージ ニーズを適切に満たす必要があります。 記憶域ネットワーク (SAN) ストレージ ポリシーを使用して、VM で使用するストレージの特性と動作を定義できます。 ポリシーを使用して、ワークロードの特定の要件に従って、データ保護、パフォーマンス、およびスペース効率の設定を構成できます。 Azure VMware Solutionの既定のストレージ ポリシーは冗長です。 その結果、マシンで追加の vSAN ノードにデータをコピーする必要がある場合は、データが強化された冗長性要件を満たしていることを確認する別のポリシーを作成します。

Recommendations
  • 必要な回復性に基づいて、許容する障害 (FTT) レベルまたは障害許容度を判断します。
  • データの可用性とホストとディスクの障害に対する保護を確保するのに役立つ、独立ディスク (RAID) 構成の冗長配列を選択します。

Azure NetApp Files を使用する

影響: 信頼性、パフォーマンス効率

プライベート クラウドのストレージを超える予定の場合、Azure VMware SolutionのAzure NetApp Filesは、ディスク割り当てを拡張し、高パフォーマンス、低待機時間、スケーラブルなストレージ プラットフォームを提供するもう 1 つのソリューションです。 Azure NetApp Filesは、ワークロードのニーズに基づいてストレージ容量とパフォーマンスレベルを動的に調整します。 その結果、Azure VMware Solution環境は、ストレージ要件の拡大に合わせてスケーリングできます。

Azure VMware Solutionと対話するAzure NetApp Filesなどの Azure サービスが、Azure VMware Solutionデプロイされているのと同じゾーンにあることを確認します。 アプリケーションのすべてまたは一部が待機時間に対して非常に機密性の高い場合は、コンポーネントのコロケーションが必要になる可能性があります。 その場合、マルチリージョン戦略とマルチゾーン戦略の適用性は制限されます。 ただし、コロケーションにより待機時間が短縮されるため、アプリケーションはより迅速に応答します。 たとえば、ディスクの拡張にコロケーションが重要なAzure NetApp Filesに基づくデータストアを使用する場合です。

Recommendations
  • Azure VMware Solutionの追加データストアとして、Azure NetApp Filesまたはサードパーティソリューションを使用することを検討してください。
  • アプリケーション評価を行って、Azure VMware Solution ノードとAzure NetApp Filesなどの外部ストレージ ソリューションの最適な組み合わせを判断します。
Recommendations
  • ノード交換プロセス中にデータが失われないようにするための手順を用意します。

ベースライン パフォーマンスを確立する

影響: オペレーショナル エクセレンス

パフォーマンス ベースラインを確立すると、Azure VMware Solutionの機能に関する分析情報が得られ、パフォーマンスの制約を特定するのに役立ちます。

Recommendations
  • Azure VMware Solution プライベート クラウドに移行する前に、ツールを使用して既存の環境をベンチマークします。 ベースライン パフォーマンスを確立するために使用できる一般的なユーティリティには、 VMware vRealize OperationsPerfmoniostat などがあります。
  • プライベート クラウドの容量を見積もる場合は、パフォーマンスベースAzure VMware Solution評価を使用します。

デバッグツールとトラブルシューティング ツールを使用する

影響: オペレーショナル エクセレンス

SDDC の問題を特定、トラブルシューティング、修正するための体系的なアプローチを採用すると、解決時間が短縮されます。 運用チームは、ワークロードで発生している問題または症状と問題の範囲を定義できる必要があります。 また、エラー メッセージ、ログ、問題をトリガーする特定の条件やアクションなど、情報を収集できる必要もあります。

インフラストラクチャの監視の詳細については、「Azure VMware Solution ワークロードの監視に関する考慮事項」を参照してください。

Recommendations
  • 次のデバッグおよびトラブルシューティング ツールについて理解します。 これらのツールは、潜在的なパフォーマンスのボトルネックをすばやく特定するために不可欠です。

次の手順

基になるAzure VMware Solution プラットフォームを調べたので、データベース、VM、オペレーティング システム、構成を含むアプリケーション プラットフォームを調査します。

評価ツールを使用して、設計の選択を評価します。