次の方法で共有


データセンターのアーキテクチャとインフラストラクチャ

Microsoft データセンターは、多層防御の戦略を実装し、クラウド アーキテクチャを確実に保護するための複数レイヤーのセーフガードを採用し、インフラストラクチャをサポートするように設計されています。 冗長性は、データセンターの可用性をサポートするために、複数のレベルのすべてのシステムに組み込まれています。

Microsoft は、世界中に広がる高度にセキュリティで保護されたデータセンター施設を持ち、分散データセンター インフラストラクチャを作成し、何千ものオンライン サービスをサポートしています。 このグローバルに分散されたインフラストラクチャは、アプリケーションをユーザーに近づけ、データ所在地を保持し、包括的なコンプライアンスと回復性のオプションを顧客に提供するように設計されています。

リージョンは、大規模で回復性の高いネットワークを介して相互接続されるデータセンターのセットです。 リージョンは地域に編成され、特定のデータ所在地とコンプライアンスを持つお客様に、データとアプリケーションを近くに保つ機能が必要です。 組み込みのフォールト トレランスにより、地域は専用の大容量ネットワーク インフラストラクチャへの接続を通じて、リージョン全体の障害に耐えることができます。

リージョン内の物理的に分離された場所は可用性ゾーンと呼ばれ、それぞれが独立した電源、冷却、ネットワークを備えた 1 つ以上のデータセンターで構成されています。 可用性ゾーンを使用すると、ミッション クリティカルなアプリケーションを高可用性と待機時間の短いレプリケーションで実行できます。

次の図は、グローバル インフラストラクチャが、高可用性、ディザスター リカバリー、バックアップのために同じデータ所在地の境界内のリージョンと可用性ゾーンをペアにする方法を示しています。

データ所在地の境界。

地理的に分散されたデータセンターを使用すると、Microsoft はサービスを顧客に近づけ、ネットワーク待機時間を短縮し、geo 冗長バックアップとフェールオーバーを可能にします。

Availability

Microsoft データセンターは、顧客の SLA とサービス ニーズを満たすために 99.999% の可用性を提供するように設計されています。 Microsoft は、サービスを 24 時間 365 日提供する施設のグローバルな運用、管理、ネットワーク、持続可能性に大きく投資しています。

コンプライアンス標準と要件

Microsoft は、グローバル インフラストラクチャの構築に 150 億ドル以上、研究開発に 90 億ドルを超える投資を行い、効率を高め、イノベーションを推進しています。 その結果、Microsoft のデータセンターは業界の多くの施設よりも急速に進化しているため、従来のデータセンター標準で説明されている規範的な要件に従いません。 Microsoft は、世界最大のデータセンター ポートフォリオの 1 つを実行する豊富な運用分析情報に加えて、IEEE Gold Book データとサードパーティの信頼性シミュレーション ソフトウェアを使用して、データセンターの設計基準を継続的に改善しています。 Microsoft データセンターは、コンプライアンス ポートフォリオで呼び出されるいくつかの規制監査の一環として広範に監査されます。 Microsoft データセンターの成熟度レベルは、コンプライアンス ポートフォリオを通じて評価でき、具体的には ISO 22301 認定の回復性を評価できます。

Microsoft は、ANSI/TIA-942 データセンターの電気通信インフラストラクチャの精神に沿ってプログラムを運用Standardが、この標準の一部は Microsoft に適用されないか、他の規制や国/地域固有の要件と競合します。 さらに、Microsoft は、お客様のニーズに合わせて、よりパフォーマンスベースのアプローチを使用することを選択しました。

データとネットワークの冗長性

重要なデータセンター施設は、何層もの冗長システムを導入してエラーに耐え、サービスの中断を最小限に抑えます。 ディスク レベルのローカル冗長ストレージは、地域内のデータを保護します。地理冗長ストレージは、地域内の冗長性を提供します。 信頼性の高いネットワーク通信を確保するために、Microsoft は多様なファイバー ルートと冗長ハードウェアを所有して利用し、重要なコンポーネントを障害やサービスの中断から保護しています。

geo レプリケーションは、別の地理的な場所に冗長性を提供するために使用されます。 データの持続性は、異なるデータセンター内の複数のデータベース間でデータを同期的にレプリケートすることで得られます。 復元テストは、クラウドが所有するすべてのバックアップ データに対して実行されます。 ディザスター リカバリーは、異なる地理的リージョンのデータセンターへの非同期レプリケーションによって実現されます。

キャパシティ

Cloud Operations は、必要な容量が構造化され、顧客と内部で使用できるように将来の要件を予測する専用の容量チームです。 許容されるサービス パフォーマンス、可用性、サービス使用率、ストレージ使用率、ネットワーク待機時間、監査ログ容量を確保するために、システムが監視されます。 また、Microsoft は、帯域幅、トランザクション容量、ストレージ容量に対するサービス拒否攻撃の影響からデータセンターを保護します。

すべてのサービス チームには、データセンター モデルの重要な機能として容量計画とデータ レプリケーション 計画が含まれており、情報処理、通信、環境サポートに必要な容量があることを確認します。

Power

Microsoft のデータセンターには、専用の 24 時間 365 日の無停電電源装置 (UPS) と非常用電源サポートがあります。これには、バックアップ電源を提供するオンサイト ジェネレーターが含まれています。 UPS と発電機両方のために定期的なメンテナンスと試験が行われています。また、運用チームは地元のベンダーと緊急時の燃料供給契約を結んでいます。 データセンターには、重要な電気部品を含む電力システムを監視する専用のファシリティ オペレーション センターもあります。

Microsoft データセンターには、保護スペースとケーブルの適切なラベル付けが装備されています。 電力インフラ機器は、環境リスクから保護するために設計された環境に配置されています。 すべてのポータブルオンライン サービスの資産は、盗難や移動の損傷から保護するために、所定の場所にロックまたは固定する必要があります。 電源ケーブルは、床の下、ケーブル トレイのオーバーヘッド、および可動部分からの保護と偶発的な損傷のためのキャビネット内で実行されます。 すべての電気スペースは、カードリーダーまたは必要に応じて追加のキー ロックの背後にあります。 廊下、外観の入り口、設備のヤードへのアクセスはすべて、ビデオ監視を介して監視されます。 また、電力システムは冗長性を保護の一形態として利用し、複数の電力/ユーティリティが施設や発電機やUPSシステムに送り込まれます。

最小限に必要な運用能力で電力を維持できる情報システムには、長期的な代替電源が実装されています。 電源が故障したり、許容できない電圧レベルに低下したりすると、UPSシステムはすぐにオンラインになります。 これにより、ジェネレーターが引き継ぐまで、サーバーを実行するのに十分な電力が提供されます。 非常用発電機は、長時間の停電、計画メンテナンスのためのバックアップ電源を提供し、自然災害が発生した場合は、敷地内の燃料予約でデータセンターを運用できます。

Microsoft データセンター (リースとフル マネージドの両方) では、UPS と発電機システムによってバックアップされた専用回線に、オーバーヘッド緊急照明の形式で緊急照明が実装されます。 自動緊急照明は、全国消防保護協会(NFPA)の生命安全法または適用される現地コード/法律に従って実施されます。 ユーティリティ電源が失われた場合、緊急照明は自動的にUPSおよび発電機システムによって提供される電力に切り替わります。 データセンター内の非常用照明システムは、適切な作業順序を維持するために定期的なメンテナンスを行います。

保守

システム メンテナンス ポリシーと手順は、Microsoft のオンライン サービス物理および環境セキュリティ Standardに従って実施されます。 運用効率を保証するために、すべての Microsoft の機器とシステムが定期的に維持されます。 機器またはシステムのメンテナンスは、製造元の推奨事項に従って実行し、承認された担当者によって実行され、メンテナンス チケットに記録される必要があります。

さまざまな種類のシステムを維持する 2 つの資産チームがあります。

  • クリティカル環境 (CE) チーム:

    • CE は、施設の運用インフラストラクチャを構成する電気、機械、物理システムの施設管理を提供するチームです。 CE チームは、CE コンポーネントに対して実行されたすべてのメンテナンス アクティビティをスケジュール、実行、ドキュメント、およびレビューします。 Microsoft データセンターは、メンテナンス スケジュールと作業指示書を管理するために、コンピューター化されたシステムに依存しています。
    • Datacenter管理 (DCM) は、サイトまたはリモートで実行されるすべての CE メンテナンスを担当します。 CE メンテナンスは、手順のメソッド (MOP) と呼ばれる必要なステップ バイ ステップ ドキュメントで規定されています。 MOP は、作業を開始する前にデータセンター管理によってレビューまたは承認されます。
  • Site Services チーム:

    • Site Services は、Microsoft データセンターにある Microsoft オンライン サービス資産のサービスを提供するチームです。 DC Site Services チームは、データセンターからのプロパティ プロビジョニング サービスに属する資産に対してスマートハンズ/ブレーク修正サービスを提供します。 たとえば、物理的なメンテナンスを必要とする資産は、DC Site Services チームにスマート ハンズ サービスを要求できます。 Microsoft 資産に対するすべての Site Services の作業は、ワークフロー チケット ツール内の作業チケットでスケジュール、実行、文書化、およびレビューされ、承認された作業チケットなしでは作業を実行できません。
    • テクニカル プログラム マネージャー (TPM) と DCM チームは、データセンターで発生するすべての Site Services 作業と、資産をオフサイトに転送する必要がある作業を担当します。 Site Services のメンテナンスは、物理的なセキュリティ メカニズムによって制御および保護されているデータセンターの領域で実行されます。

CE コンポーネントを施設から取り外す必要がある場合、装置の取り扱いは DCM によって承認されます。 ほとんどの場合、CE コンポーネントはオンサイト メンテナンスを受け取り、施設から削除されません。 オフサイトへの転送を必要とするプロパティ資産 (ネットワーク デバイスやサーバーなど) には、明示的な資産所有者の承認が必要です。

クラウド内のデジタル メディアは、破棄されるように移動しない限り、コロケーション空間から転送されない場合があります。 これらの資産が破棄されると、CCTV カメラカバレッジの下にあるロックされた棚番に格納されます。 資産を破棄する準備ができたら、資産管理の物理的なセキュリティ責任者と Microsoft のフルタイムの従業員は、コロケーションスペースからオンサイトのシュレッディングが発生する場所にロックされたビンを護衛する必要があります。 データセンターと Microsoft の監督下でシュレッディングが発生するにつれて、Microsoft 資産はデータセンターの制御された領域から離れるわけではありません。

システム メンテナンス ツールへのアクセスを含め、作業を開始する前にすべてのメンテナンス作業を承認する必要があります。 Microsoft インフラストラクチャでは、Datacenter アクセス ツール (DCAT) 内にアクセス レベルを作成することで、メンテナンス ツール制御を実装しました。 各施設には、特殊なメンテナンスツールを保管するための制限付き物理的なロックボックスまたはアクセス制御された部屋が含まれています。 ロックボックスまたは収納室へのアクセスは、メンテナンスツールへの不正アクセスを禁止するためにDCATツールで制御されます。 このプログラムにより、アクセスが承認された担当者のみがツールにアクセスできるようになります。 Site Services チームは、すべてのツールの状態を確認するために、定期的なインベントリ チェックを実行します。 データセンター管理チームと物理セキュリティ チームは、四半期ごとに DCAT アクセス リストの監査を実行して、メンテナンス担当者のアクセス リストを最新の状態に保ちます。 担当者の終了または転送は、アクセス リストの手動更新によって直ちに反映されます。 ロック ボックスまたはメンテナンス ストレージ ルームへのアクセスは、アクセス バッジ リーダー ログで追跡され、調査に使用できます。

Site Services チームは、データセンター内で使用するために承認されたメンテナンス ツールのインベントリを保持します。 メンテナンス担当者は、提供されたメンテナンス ツールを使用するように指示されます。 データセンターによって提供されていないツールを使用するには、Datacenter管理 (DCM) の承認が必要です。 物理的なハンド ツールは、この種類のコントロールから除外されます。

Microsoft データセンターは、重要なデータセンター インフラストラクチャ システム (Critical Environment チーム) とデータセンター運用 (Site Services チーム) をサポートするために、常駐メンテナンス担当者を維持します。 クリティカル環境チームと Site Services チームは、オンサイトで予備を維持する重要なセキュリティとテクノロジ システム コンポーネントを特定しました。 重要な情報システム サービスは、1 つのデータセンターでのインシデントによるサービスの中断を防ぐために、複数のデータセンターからプロビジョニングされます。