次の方法で共有


データセンターのアーキテクチャとインフラストラクチャ

Microsoft データセンターは、多層防御の戦略を実装し、クラウド アーキテクチャを確実に保護するために複数の保護層を採用し、インフラストラクチャをサポートするように設計されています。 冗長性は、データセンターの可用性をサポートするために、複数のレベルのすべてのシステムに組み込まれています。

Microsoft は、世界中に広がる高度にセキュリティで保護されたデータセンター施設を持ち、数千のオンライン サービスをサポートする分散型データセンター インフラストラクチャを作成しています。 このグローバルに分散されたインフラストラクチャは、アプリケーションをユーザーに近づけ、データの所在地を維持し、顧客に包括的なコンプライアンスと回復性のオプションを提供するように設計されています。

リージョンは、大規模で回復性の高いネットワークを介して相互接続されるデータセンターのセットです。 リージョンは地域に分類され、特定のデータ所在地を持つ顧客に付与され、コンプライアンスにはデータとアプリケーションを近くに保つ機能が必要です。 フォールト トレランスが組み込まれているので、地域は専用の大容量ネットワーク インフラストラクチャへの接続を通じて、完全なリージョン障害に耐えられます。

リージョン内の物理的に分離された場所は可用性ゾーンと呼ばれ、それぞれが独立した電源、冷却、ネットワークを備えた 1 つ以上のデータセンターで構成されます。 可用性ゾーンを使用すると、ミッション クリティカルなアプリケーションを高可用性と低待機時間のレプリケーションで実行できます。

次の図は、グローバル インフラストラクチャが、高可用性、ディザスター リカバリー、およびバックアップのために、同じデータ常駐境界内のリージョンと可用性ゾーンをどのようにペアにするかを示しています。

データ所在地の境界。

地理的に分散されたデータセンターを使用すると、Microsoft はサービスを顧客に近づけ、ネットワーク待機時間を短縮し、geo 冗長バックアップとフェールオーバーを可能にします。

Availability

Microsoft データセンターは、お客様の SLA とサービスのニーズを満たすために 99.999% の可用性を提供するように設計されています。 Microsoft は、サービスを 24 時間 365 日提供する施設のグローバル運用、管理、ネットワーク、および持続可能性に大きく投資しています。

コンプライアンス標準と要件

Microsoft は、効率を高め、イノベーションを推進するために、150 億ドルを超えるグローバル インフラストラクチャの構築と 90 億ドルを超える研究と開発に投資してきました。 その結果、Microsoft のデータセンターは業界の多くの施設よりも急速に進化しているため、従来のデータセンター標準で概説されている規範的な要件には従いません。 Microsoft では、世界最大のデータセンター ポートフォリオの実行に関する豊富な運用分析情報に加えて、IEEE Gold Book データとサードパーティの信頼性シミュレーション ソフトウェアを使用して、データセンターの設計基準を継続的に改善しています。 Microsoft データセンターは、コンプライアンス ポートフォリオで説明されているように、いくつかの規制監査の一環として広範に監査されます。 Microsoft データセンターの成熟度のレベルは、コンプライアンス ポートフォリオを通じて評価でき、特に回復性については ISO 22301 の認定を受けることができます。

Microsoft は ANSI/TIA-942 Telecommunications Infrastructure of Datacenters Standard の理念に沿ってプログラムを運用していますが、この標準の一部は Microsoft に適用されないか、他の規制や国固有の要件と競合します。 さらに、Microsoft は、顧客のニーズに合わせて、よりパフォーマンスベースのアプローチを使用することを選択しました。

データとネットワークの冗長性

重要なデータセンター施設は、何層もの冗長システムを導入してエラーに耐え、サービスの中断を最小限に抑えます。 ディスク レベルのローカル冗長ストレージは、地域内のデータを保護します。地理冗長ストレージは、地域内の冗長性を提供します。 信頼性の高いネットワーク通信を確保するために、Microsoft は多様なファイバー ルートと冗長ハードウェアを所有して利用し、重要なコンポーネントを障害やサービスの中断から保護しています。

geo レプリケーションは、代替地理的な場所に冗長性を提供するために使用されます。 データの持続性は、異なるデータセンター内の複数のデータベース間でデータを同期的にレプリケートすることによって取得されます。 復元テストは、クラウドが所有するすべてのバックアップ データに対して実行されます。 ディザスター リカバリーは、別の地理的リージョンにあるデータセンターへの非同期レプリケーションによって実現されます。

キャパシティ

Cloud Operations は、将来の要件を予測する専用のキャパシティ チームであり、必要な容量が構造化され、顧客と内部で使用できるようにします。 許容可能なサービス パフォーマンス、可用性、サービス使用率、ストレージ使用率、ネットワーク待機時間、監査ログ容量を確保するために、システムが監視されます。 また、Microsoft は、サービス拒否攻撃が帯域幅、トランザクション容量、ストレージ容量に及ぼす影響からデータセンターを保護します。

すべてのサービス チームには、情報処理、通信、環境サポートに必要な容量があることを保証するために、データセンター モデルとデータ レプリケーション計画の主要な機能として容量計画が含まれています。

電源

Microsoft のデータセンターには、専用の 24 時間 365 日無停電電源装置 (UPS) と緊急電源サポートがあります。これには、バックアップ電源を提供するオンサイト ジェネレーターが含まれています。 UPS と発電機両方のために定期的なメンテナンスと試験が行われています。また、運用チームは地元のベンダーと緊急時の燃料供給契約を結んでいます。 データセンターには、重要な電気部品を含む電力システムを監視する専用のファシリティ オペレーション センターもあります。

Microsoft データセンターには、保護スペースとケーブル用の適切なラベルが備わっています。 電源インフラストラクチャ機器は、環境リスクから保護するために設計された環境に配置されます。 盗難や移動による損害に対する保護を提供するには、すべてのポータブル オンライン サービス' 資産を固定または固定する必要があります。 電源ケーブルは、フロアの下、ケーブル トレイのオーバーヘッド、キャビネット内で実行され、部品の移動や偶発的な損傷から保護されます。 すべての電気空間は、必要に応じてカード リーダーまたは追加のキー ロックの背後にあります。 アクセスの通路、外部の入り口、および機器の建物はすべて、ビデオ監視を介して監視されます。 また、電源システムは、複数の電源/ユーティリティフィードを設備や発電機、UPS システムに供給して、冗長性を保護の一形態として利用します。

最小限必要な運用機能で電力を維持できる情報システムには、長期的な代替電源が実装されています。 電源が故障したり、許容できない電圧レベルに低下したりすると、UPS システムは即座にオンラインになります。 これにより、ジェネレーターが引き継ぐまで、サーバーを実行するのに十分な電力が提供されます。 緊急ジェネレーターは、長時間の停止、計画メンテナンスにバックアップ電源を提供し、自然災害が発生した場合は、オンサイトの燃料予約を使用してデータセンターを運用できます。

Microsoft データセンター (リースとフル マネージドの両方) では、UPS とジェネレーター システムによってバックアップされた専用回線にオーバーヘッド緊急照明の形で緊急照明が実装されています。 自動緊急照明は、全米火災保護協会 (NFPA) の生活安全コードまたは適用される現地のコード/法律に従って実装されます。 ユーティリティ電源が失われた場合、緊急照明は UPS およびジェネレーター システムによって提供される電力に自動的に切り替わります。 データセンター内の緊急照明システムは、定期的なメンテナンスを行い、適切な動作状態を維持します。

保守

システム メンテナンス ポリシーと手順は、 Microsoft の Online Services Physical and Environmental Security Standard に従って行われます。 運用効率を保証するために、すべての Microsoft の機器とシステムが定期的に管理されています。 すべての機器またはシステムのメンテナンスは、製造元の推奨事項に従って実行され、承認された担当者によって実行され、メンテナンス チケットに記録される必要があります。

さまざまな種類のシステムを管理する資産チームは 2 つあります。

  • Critical Environment (CE) チーム:

    • CE は、施設の運用インフラストラクチャを構成する電気、機械、物理システムの設備管理を提供するチームです。 CE チームは、CE コンポーネントで実行されたすべてのメンテナンス アクティビティをスケジュール、実行、ドキュメント化、レビューします。 Microsoft データセンターは、コンピューター化されたシステムに依存して、メンテナンス スケジュールと作業指示を管理します。
    • データセンター管理 (DCM) は、サイトまたはリモートで実行されるすべての CE メンテナンスを担当します。 CE メンテナンスは、プロシージャのメソッド (MOP) と呼ばれる必要なステップ バイ ステップドキュメントに規定されています。 MOP は、作業を開始する前に、データセンター管理によって確認または承認されます。
  • Site Services チーム:

    • Site Services は、Microsoft データセンターにある Microsoft オンライン サービス資産のサービスを提供するチームです。 DC Site Services チームは、データセンターからのプロパティ プロビジョニング サービスに属する資産に対して、スマート ハンズ/ブレーク 修正サービスを提供します。 たとえば、物理的なメンテナンスが必要な資産は、DC Site Services チームにスマート ハンズ サービスを要求できます。 Microsoft 資産に対するすべての Site Services 作業は、ワークフロー チケット ツール内の作業チケットでスケジュール、実行、文書化、およびレビューされ、承認された作業チケットなしでは作業を行うことができません。
    • テクニカル プログラム マネージャー (TPM) チームと DCM チームは、データセンターで発生するすべての Site Services 作業と、資産をオフサイトに転送する必要がある作業を担当します。 Site Services メンテナンスは、物理的なセキュリティ メカニズムによって制御および保護されているデータセンターの領域で実行されます。

CE コンポーネントを設備から削除する必要がある場合、機器の処理は DCM によって承認されます。 ほとんどの場合、CE コンポーネントはオンサイト メンテナンスを受け、設備から削除されません。 譲渡オフサイトを必要とするプロパティ資産 (ネットワーク デバイスやサーバーなど) には、明示的な資産所有者の承認が必要です。

クラウド内のデジタル メディアは、破棄されるように移動されない限り、コロケーション空間から転送できない場合があります。 これらの資産を破棄する場合は、CCTV カメラカバレッジの下にあるロックされたストレージ ビンに格納されます。 資産を破棄する準備ができたら、物理的なセキュリティ担当者と資産管理の Microsoft 正社員が、コロケーション空間からオンサイトのシュレッディングが発生する場所まで、ロックされたビンを付き添う必要があります。 データセンターと Microsoft の監督下で細断が発生すると、Microsoft 資産はデータセンターの管理領域を離れるわけではありません。

システム メンテナンス ツールへのアクセスを含め、作業を開始する前にすべてのメンテナンス作業を承認する必要があります。 Microsoft インフラストラクチャでは、データセンター アクセス ツール (DCAT) 内にアクセス レベルを作成することで、メンテナンス ツール制御を実装しました。 各施設には、特殊なメンテナンス ツールを保管するための制限付き物理ロック ボックスまたはアクセス制御ルームが含まれています。 ロック ボックスまたはストレージ ルームへのアクセスは、メンテナンス ツールへの不正アクセスを禁止するために、DCAT ツールで制御されます。 このプログラムにより、承認されたアクセス権を持つ担当者のみがツールにアクセスできるようになります。 Site Services チームは、定期的なインベントリ チェックを実行して、すべてのツールの状態を確認します。 四半期ごとに、データセンター管理チームと物理セキュリティ チームが DCAT アクセス リストの監査を実行して、メンテナンス担当者のアクセス リストを最新の状態に保ちます。 担当者の終了または転送は、アクセス リストの手動更新によって直ちに反映されます。 ロック ボックスまたはメンテナンス ストレージ ルームへのアクセスは、任意の調査に使用できるアクセス バッジ リーダー ログで追跡されます。

Site Services チームは、データセンター内で使用するために承認されたメンテナンス ツールのインベントリを保持します。 メンテナンス担当者は、提供されたメンテナンス ツールを使用するように指示されます。 データセンターによって提供されていないツールを使用するには、Datacenter Management (DCM) の承認が必要です。 物理的なハンド ツールは、この種の制御から除外されます。

Microsoft データセンターは、重要なデータセンター インフラストラクチャ システム (Critical Environment チーム) とデータセンター運用 (Site Services チーム) をサポートするために、常駐メンテナンス担当者を維持します。 Critical Environment チームと Site Services チームは、オンサイト用のスペアを維持する重要なセキュリティとテクノロジ システム コンポーネントを特定しました。 重要な情報システム サービスは、1 つのデータセンターでのインシデントによるサービスの中断を防ぐために、複数のデータセンターからプロビジョニングされます。