Azure VMware Solution ワークロードの運用に関する考慮事項
この記事では、Azure VMware Solution の運用設計領域について説明します。 この記事の目的は、Azure VMware Solution と、VMware ソフトウェア定義データセンター (SDDC) 内のアプリケーションの運用モデルを構築することです。 標準の運用手順 (SOP) は、ワークロードを管理するための文書化されたプロセスです。 各 Azure VMware Solution ワークロードには、運用を管理するための SOP が必要です。 事業目標との整合性を保ち、ベスト プラクティスから逸脱することを防ぐために、Azure VMware Solution ワークロードに対して実行する評価と正常性チェックの継続的なサイクルの中で SOP を使用します。
アプリケーションの依存関係を追跡する
"影響: オペレーショナル エクセレンス"
IT チームは、アプリケーション、サイト、サービスの展開、管理、およびメンテナンスを最適化するために継続的に取り組んでいます。 このプラクティスは、ハイ パフォーマンス、信頼性、スケーラビリティ、セキュリティを確保するのに役立ちます。 最適化するには、Azure VMware Solution プラットフォーム内でのアプリケーションがのフローを理解する必要があります。 また、プライベート クラウド外部の外部依存関係とリレーションシップを調べる必要もあります。 依存関係マップは、アプリケーションの構造と動作を理解しようとする開発者、アプリケーション アーキテクト、IT チームにとって重要なツールです。 ソフトウェアやインフラストラクチャ、サービス、外部依存関係などのアプリケーション コンポーネントを把握することで、データ フロー、機能、API 呼び出しを視覚的に理解できるようになります。
推奨事項
- Application Insights を使用して、データベース、API 呼び出し、外部サービスなどの依存関係を追跡します。
- Azure Monitor のサービス マップ機能を使用して、さまざまなアプリケーションとインフラストラクチャ コンポーネントを自動的に検出して視覚化します。
- New Relic や Datadog などのサードパーティ ツールを使用して依存関係を検出し、マッピングします。
- 依存関係の自動化とデプロイを追跡するカスタム スクリプトまたはサードパーティ構成管理ツールを使用します。
自動化、バージョン管理システム、およびブルーグリーン デプロイを使用する
"影響: オペレーショナル エクセレンス"
組織は DevOps プラクティスを採用することで、市場投入までの時間を短縮し、コラボレーションとソフトウェア品質の向上によるメリットを得ることができます。 たとえば、自動化によりアプリケーションのデプロイとメンテナンスを迅速化できます。
コードとしてのインフラストラクチャ (IaC) を使用してインフラストラクチャのデプロイを整理すると、インフラストラクチャのプロビジョニングの効率が向上するというメリットを得ることができます。 また、IaC によってインフラストラクチャ管理における DevOps の原則の導入が容易になります。
- IaC を使用して、Azure VMware Solution に複数のリソースを作成できます。 例としては、プライベート クラウド全体、またはクラスター、ネットワーク アプライアンス、ストレージなどの個々のコンポーネントが挙げられます。 Azure Resource Manager、Bicep、Terraform、Azure CLI、PowerShell などのツールは、Azure VMware Solution でのリソースのプロビジョニングと構成を自動化します。
- IaC を使用すると、コードを変更することでインフラストラクチャを更新できます。 このアプローチにより、手動での構成とプロビジョニングに必要な時間と労力が軽減されます。
- IaC のデプロイから返される出力は、プロビジョニングされたリソースの状態と構成を維持し、さらに可視化するのに役立つドキュメントとして機能します。
バージョン管理システムは、コードを管理し、バージョン管理を使用して必要に応じて変更を追跡およびロールバックする方法を提供します。
サーバー間でアプリケーション コードを更新する必要がある場合、ブルーグリーン デプロイはさまざまな点で役立ちます。
- 開発から運用までのアプリケーションのライフサイクルの管理に役立ちます。
- 更新やパッチを適用している際に顧客に一貫した Web エクスペリエンスを提供するのに役立ちます。
- 重み付きアルゴリズムを使用して、メンテナンス中に正常なサーバーにのみトラフィックを分散します。
Azure VMware Solution では、クラウドネイティブ アプリケーションに用意されている、ブルーグリーン デプロイを実現するための方法は提供されません。 ただし、Azure VMware Solution では引き続き次のデプロイが可能です。
- アプリケーション構成を変更する前に、環境のスナップショットを作成する。
- バージョン管理を使用して、最後に確認された正常な状態に戻れるようにする。
- 運用環境をミラーリングし、運用を開始する前に更新プログラムを展開するステージング環境を作成することを検討する。
- ステージング環境から、サーバーのサブセットに対してローリング アップデートを実行し、アプリケーションをテストする。
プロビジョニング、スケーリング、修正プログラムの適用などの日常的なタスクを自動化することで、手動での作業を減らし、エラーを最小限に抑え、リソース使用率を向上させることができます。 DevOps 手法は、運用を合理化し、時間を節約し、チームが付加価値の高いアクティビティに集中できるようにするための、適切に設計されたソリューションの重要な要素です。
推奨事項
- IaC を使用して、反復可能、監査可能、かつ一貫性のある方法でインフラストラクチャをデプロイおよびプロビジョニングします。
- IaC を使用して拡張と縮小を自動化します。
- バージョン管理システムを使用して、変更を追跡し、共同作業を行い、必要に応じて以前のバージョンにコードをロールバックします。
- 本番環境を開始する前に、本番環境とテスト環境を反映するステージング環境を作成することで、ブルー グリーン コンセプトを活用します。
- スナップショットを使用し、ディスクを複製し、コードをバージョン管理することで、アプリケーションの最後の良好な状態を維持します。
ロールとプロセスを定義する
"影響: オペレーショナル エクセレンス"
ロールと責任を明確に定義することで、適切に設計された Azure VMware Solution ワークロードの明確性、説明責任、および効果的な管理を保証できます。 定義された一連の標準と構造化されたプロセスを用意し、誰がそれらを実行するかを把握することは、効率的な運用につながり、IT 組織が技術的なオファリングを事業目標と戦略に合致させるのに役立ちます。 Azure VMware Solution 環境の成長と進化に伴い、ロールと責任が明確に定義されることで、タスクの委任が容易になり、中断することなくソリューションを拡張できるようになります。 その結果、アプリケーションのユーザーのエクスペリエンスが向上します。
プライベート クラウド内のアプリケーションに対する効率的な日常業務に焦点を当てた継続的な改善の文化を持つことが重要です。 運用の例としては、サービス レベル アグリーメント (SLA) の維持、可用性の維持、サービスの中断を最小限に抑える能力の確保、スムーズな配信などが挙げられます。 たとえば、Azure VMware Solution を使用すると、最小限のユーザー入力で環境を拡張できます。 契約を手動で拡張する場合は、関連するアクティビティを誰がどのように実行するかを文書化する必要があります。Azure VMware Solution オペレーターは、必要に応じてノード予約を使用して環境を拡張できるようにする必要があります。 たとえば、使用率が低いまたはアイドル状態のリソースを特定する担当者を指定します。 そして、それらの担当者に、仮想マシン (VM) のサイズを適切に調整して不要なコストを削減するプロセスをまかせます。
アプリケーション チームと開発者は、コード構造、例外、およびエラー処理のコーディング ガイドラインを定義する必要があります。 また、定期的なコードレビュー、API ドキュメント、定期的なコードのリファクタリングなど、変更を追跡する方法も必要です。 バージョン管理を使用する場合は、分岐、コミット メッセージ、承認ワークフローなどのベスト プラクティスを適用します。 これらのプラクティスは、コードの一貫性を保ち、デバッグを容易にし、保守性を高めるのに役立ちます。
推奨事項
- クラウド センター オブ エクセレンス (CCoE) チームと連携して、コンプライアンス、セキュリティ、アプリケーション アーキテクチャ、運用プロセスの標準とガイドラインを理解します。
- セキュリティおよびコンプライアンス チームに Azure VMware Solution に特化したセキュリティ ポリシーに注力させます。 また、チームにリスク評価を実施させ、規制要件への準拠を徹底させます。
- Information Technology Infrastructure Library (ITIL) などのフレームワークを採用します。 または、国際標準化機構 (ISO) のプラクティスを使用して、日常の運用、プロセス、アクティビティをマッピングします。 これらのプラクティスは、知識移転の迅速化、継続的な改善、変更管理の改善をもたらします。
- アプリケーション開発時にコーディング標準を定義し、セキュリティ プラクティスを実装します。
タグ付け戦略とベスト プラクティスを使用する
"影響: オペレーショナル エクセレンス"
チャージバックとリソース追跡にはタグ付け戦略を使用できます。 タグは、リソース レベルで定義され、プロビジョニング中に適用されるキー ペア値です。 IaC を使用して、ゲスト VM を作成、更新、破棄することができます。 タグと IaC は構成管理ツールと連携して動作します。 タグは次の領域で使用できます。
- 環境。 リソースを識別するために、production、QA、dev test などのタグを適用できます。
- コスト センター (リソースのコストと経費を追跡するため)。
- SLA (リソースの SLA 要件に優先順位を付けるため)。
- ライフサイクル。 アプリケーションには、active、archived、または retired というラベルを付けることができます。
- 重要度 (ビジネスへの影響と重要性に基づいてリソースにラベルを付ける)。
ガバナンスとコンプライアンス戦略の一環として、グループはタグのないリソースを識別する役割を果たす必要があります。 このグループは、自動化、監査、プロセスを組み合わせて、タグ付けのコンプライアンス ポリシーに準拠していないリソースを特定して修正するのに役立ちます。
これらのタグ付けの考慮事項は一般的なものです。 タグ付け戦略では、Azure VMware Solution 内で効果的なリソース分類、リソース ライフサイクル管理、およびレポート作成がサポートされていることが重要です。
推奨事項
- 組織分類を使用してワークロードとインフラストラクチャを識別することにより、リソース管理用のタグを適用します。 分類には、ホスト、事業、所有者、環境を含める必要があります。
- 適切なツールを使用して、プロビジョニング中にプログラムによってタグを維持および適用します。
- SLA、チャージバック ポリシー、ライフサイクル管理プラクティスなど、組織のコンプライアンスとガバナンスの取り組みに合ったタグを使用します。
- タグ付け要件に準拠していないリソースを識別して修正するためのプロセスを導入します。
インシデント対応チームを設置する
"影響: オペレーショナル エクセレンス"
プライベート クラウド内のワークロードの状態を追跡するには、CPU 使用率、オペレーティング システムのログ、セキュリティ アラートなどのメトリックを監視することが不可欠です。 アラート システムの有効性を確保するには、いくつかの主要な運用面を評価する必要があります。 具体的には、以下のことを確認します。
- データベース、ネットワーク デバイス、ストレージなど、すべての重要なコンポーネントが識別されている。
- しきい値が適切に設定されている。
- アラートは具体的かつ実用的である。
- 適切なユーザーがアラートを受信している。
- ノイズや誤検知が大量に発生していない。
- 適切なエスカレーション手順が用意されている。
インシデントや停止が発生する前に、適切に定義された通知プロセスを確立して、タイムリーなコミュニケーションを確保することが重要です。 解決に責任を持つ関連する担当者を特定することが不可欠です。 専任の修復チームには、問題を迅速に解決するために必要な専門知識を持つ運用担当者、アプリケーション所有者、DevOps の専門家を含めることができます。 運用チームは、各問題のトリアージに関与すべき適切な担当者を把握していなければなりません。
インシデント対応チームは、包括的な配布リストを管理することで、対応を効果的に連携できます。 このリストには、ビジネスに不可欠な部門の主要な利害関係者と、指定されたエスカレーション担当者が含まれている必要があります。 インシデントによって運用に生じる可能性のある影響については、ビジネス関係者に通知する必要があります。 割り当てられたエスカレーション担当者は、意思決定を行ったり、問題をより上位レベルにエスカレーションしてガイダンスを得ることができる個人である必要があります。
配布リストを定期的にレビューすることは、その正確性と現在のロールおよび責任との整合性を確保するために非常に重要です。 レビューすることで、Azure VMware Solution で発生した重要なイベントについて、主要な利害関係者に速やかに通知されるようにします。
IT サービス マネジメント (ITSM) ソリューションでは、イベントをタスクにマッピングできます。 たとえば、Azure ネイティブ ITSM では、タスクの管理に Azure DevOps を使用できます。 IT プロセスの自動化には Azure Automation を使用し、ワークフローの構築には Azure Logic Apps を使用できます。 その結果、Azure VMware Solution での問題管理のためのカスタマイズされたソリューションが実現します。
推奨事項
- Azure VMware Solution のアラートとインシデントの適切な受信者を定義します。
- 連絡可能で、意思決定を行ったり、問題をエスカレーションしたりする権限を持つエスカレーション担当者を明確に定義します。
- 潜在的な影響を確実に把握し、ガイダンスを提供するために、主要なビジネス関係者または代表者を特定します。
- 問題に対処して解決するために必要な専門知識を持つ管理者、インフラストラクチャ エンジニア、担当者で構成される修復チームを設置します。
- アラートを Azure DevOps、JIRA、ServiceNow などの ITSM と統合します。
手順を文書化する
影響:信頼性
環境内に存在するバックアップおよび回復インフラストラクチャを明確に把握することが重要です。 バックアップ ソリューションを構成するには、まずインフラストラクチャのバックアップ ターゲットを定義する必要があります。 アプリケーション、データベース、資産を Blob Storage または Azure Backup ボールトにバックアップする必要があります。 また、アプリケーションのバックアップと復元を担当する所有者を指定する必要もあります。
推奨事項
- バックアップおよび回復インフラストラクチャを明確に文書化します。
- バックアップと回復の手順を明確に文書化します。
バックアップおよび復元ソリューションを実装する
影響:信頼性
プライベート クラウドは、予期しない中断や災害が発生した場合でも、データ損失を防ぎ、ダウンタイムを最小限に抑え、運用の継続性を維持する必要があります。
事業継続のためには、Azure VMware Solution 環境内の VM と重要なデータの可用性、整合性、回復性を確保できるように、堅牢なデータ保護を実装する必要があります。 バックアップ ツールを用意する必要があります。また、それらが機能することを確認する必要もあります。 Azure VMware Solution の基本原則として、Azure VMware Solution で検証された独立系ソフトウェア ベンダー (ISV) のテクノロジをサポートするというものがあります。 利用可能なパートナーとオプションを理解することは、バックアップを成功させる上で非常に重要です。
推奨事項
- Microsoft Azure Backup Server や承認済みのサードパーティ ベンダーなど、Microsoft がサポートするバックアップ ソリューションを使用します。
注意事項
バックアップ環境内の VM が、サポート可能な OS を実行していることを確認してください。 サポートされている OS については、こちらを参照してください。
Azure Site Recovery を使用する
影響:信頼性
Azure Site Recovery は、障害が発生した場合に、Azure VMware Solution 環境内の VM のダウンタイムを最小限に抑えるために設計されたディザスター リカバリー ソリューションです。 Azure Site Recovery はフェールオーバーとフェールバックを自動化し、統制します。 組み込みの中断を伴わないテストにより、目標復旧時間 (RTO) を確実に達成できます。 Azure Site Recovery は自動化によって管理を簡素化し、高速かつ高度に予測可能な復旧時間を実現できます。
推奨事項
- リージョンの停止が長引く場合は、ワークロードを別の Azure リージョンにレプリケートして保護します。
- 代替リージョンにバックアップを送信するように Azure Site Recovery を構成します。
シークレットの切り替え
"影響: セキュリティ"
攻撃者が暗号化キーにアクセスできなければ、暗号化されたデータにアクセスしたり不正使用したりすることがより困難になります。 キー、シークレット、証明書は安全に保存し、頻繁にローテーションする必要があります。 データの整合性をセキュリティ保護し、維持するための包括的な手順には次のことが含まれます。
- データを暗号化する。
- キーを安全に保存する。
- データを送信する前にアプリケーション レベルでデータを暗号化する。
推奨事項
- Azure Key Vault を使用して、暗号化キーを保存します。
次のステップ
運用管理手順を確認したので、Azure VMware Solution ワークロードと Azure ランディング ゾーンを統合する方法を確認します。
評価ツールを使用して、選択した設計を評価します。