ヘルス サービスを使用してクラスターを監視する

適用対象: Azure Stack HCI、バージョン 23H2 および 22H2。Windows Server 2022、Windows Server 2019、Windows Server 2016

Windows Service 2016 で最初にリリースされたヘルス サービスを使用すると、記憶域スペース ダイレクトが実行されているクラスターでの日常的な監視および運用エクスペリエンスが向上します。

前提条件

既定では、ヘルス サービスは記憶域スペース ダイレクトで有効になっています。 ヘルス サービスを設定または開始するために、他の操作は必要ありません。 記憶域スペース ダイレクトの詳細については、「記憶域スペース ダイレクトの概要」を参照してください。

クラスターのパフォーマンス履歴

記憶域スペース ダイレクト クラスターから現在のパフォーマンスおよび容量の情報を取得します。 「クラスターのパフォーマンス履歴を取得する」をご覧ください。

ヘルス サービスの障害

現在の障害を表示して、デプロイの正常性を簡単に確認します。 「ヘルス サービスの障害を表示する」をご覧ください。

ヘルス サービスのアクション

自律的に実行されるヘルス サービス アクションの進行状況を追跡します。 「ヘルス サービス アクションを追跡する」をご覧ください。

Automation

このセクションでは、ディスクのライフサイクルにおいて、ヘルス サービスで自動化されるワークフローについて説明します。

ディスクのライフサイクル

ヘルス サービスは、物理ディスクのライフサイクルのほぼすべての段階を自動化します。 たとえば、展開の初期状態が完璧に正常、つまりすべての物理ディスクが正常に動作しているとします。

廃止

物理ディスクは、使用不可能になったとき、および関連する障害が発生したときに自動的に使用停止されます。 いくつかのケースを次に示します。

  • メディアの障害: 物理ディスクは明確に故障したか破損しており、交換する必要があります。
  • 通信の損失: 物理ディスクは 15 分間以上連続して接続を失っています。
  • 応答不能: 物理ディスクで 5.0 秒以上の待機時間が 1 時間以内に 3 回以上発生しています。

注意

一度に多数の物理ディスク、1 つのノード全体、またはストレージ格納装置の接続が失われた場合、こうしたディスクが根本原因である可能性は低いため、ヘルス サービスではこれらのディスクを使用停止しません

使用停止されたディスクが他の多くの物理ディスクのキャッシュとして機能していた場合、これらの物理ディスクは別のキャッシュ ディスクに自動的に再割り当てされます (利用可能なキャッシュ ディスクがある場合)。 ユーザーの操作は特に必要ありません。

回復性の復元

物理ディスクが使用停止されると、完全な回復性を復元するため、ヘルス サービスはすぐにそのディスクのデータを残りの物理ディスクにコピーし始めます。 コピーが完了すると、データは完全に保護され、再びフォールト トレラントになります。

注意

このように即時に復元を行うには、残りの物理ディスクに利用可能な容量が十分にある必要があります。

インジケーターのライトの点滅

可能な場合、ヘルス サービスは、使用停止された物理ディスクまたはそのスロットのインジケーター ライトを点滅させます。 この点滅は、使用停止されたディスクが交換されるまで無期限に続きます。

注意

場合によっては、インジケーター ライトも機能しない状態でディスクに障害が生じることがあります (完全な電源喪失など)。

物理的な交換

可能な場合は、使用停止された物理ディスクを置き換える必要があります。 多くの場合、これはホット スワップで行うことができます。つまり、ノードや記憶域エンクロージャの電源をオフにする必要はありません。 場所および部分の情報については「障害」を参照してください。

検証

交換用ディスクが挿入されると、サポートされているコンポーネント ドキュメントに対して検証が行われます (次のセクションを参照)。

Pooling

許可された場合、代替ディスクはその前身のプールに自動で置き換えられ、使用できるようになります。 この時点で、システムは完全に正常な初期状態に戻り、障害は表示されなくなります。

サポートされているコンポーネント ドキュメント

ヘルス サービスには、記憶域スペース ダイレクトで使用されるコンポーネントを、管理者またはソリューション ベンダーによって提供されるサポートされているコンポーネント ドキュメントに含まれているものに制限する実施メカニズムが用意されています。 このメカニズムにより、サポートされていないハードウェアが誤って使用されるのを防ぐことができるため、保証やサポート契約の順守に役立ちます。 この機能は現在、SSD、HDD、および NVMe ドライブを含む物理ディスク デバイスに限定されています。 サポートされているコンポーネント ドキュメントにより、モデル、製造元 (省略可能)、およびファームウェアのバージョン (省略可能) を制限できます。

使用法

サポートされているコンポーネント ドキュメントでは、XML から着想を得た構文が使用されます。 無料の Visual Studio Code やメモ帳などの使い慣れたテキスト エディターを使用して、保存して再利用できる XML ドキュメントを作成することをお勧めします。

セクション

このドキュメントには、DisksCache という 2 つの独立したセクションがあります。

Disks セクションが指定されている場合は、(Disk として) 示されているドライブのみがプールに参加できます。 一覧に含まれていないドライブはプールへの参加を禁止されるため、事実上、これらを運用環境で使用することはできません。 このセクションを空のままにすると、すべてのドライブがプールに参加できるようになります。

Cache セクションが指定されている場合は、(CacheDisk として) 示されているドライブのみがキャッシュに使用されます。 このセクションを空のままにすると、記憶域スペース ダイレクトでは、メディアの種類とバスの種類に基づいた推測が試行されます。 ここに示されているドライブは、Disks にも示されます。

重要

サポートされているコンポーネント ドキュメントは、既にプールに参加して使用されているドライブに遡及的に適用されることはありません。

<Components>

  <Disks>
    <Disk>
      <Manufacturer>Contoso</Manufacturer>
      <Model>XYZ9000</Model>
      <AllowedFirmware>
        <Version>2.0</Version>
        <Version>2.1</Version>
        <Version>2.2</Version>
      </AllowedFirmware>
      <TargetFirmware>
        <Version>2.1</Version>
        <BinaryPath>C:\ClusterStorage\path\to\image.bin</BinaryPath>
      </TargetFirmware>
    </Disk>
    <Disk>
      <Manufacturer>Fabrikam</Manufacturer>
      <Model>QRSTUV</Model>
    </Disk>
  </Disks>

  <Cache>
    <CacheDisk>
      <Manufacturer>Fabrikam</Manufacturer>
      <Model>QRSTUV</Model>
    </CacheDisk>
  </Cache>

</Components>

複数のドライブを指定するには、単に、<Disk> または <CacheDisk> タグを追加します。

記憶域スペース ダイレクトをデプロイするときにこの XML を挿入するには、-XML パラメーターを使用します。

$MyXML = Get-Content <Filepath> | Out-String
Enable-ClusterS2D -XML $MyXML

記憶域スペース ダイレクトがデプロイされた後に、サポートされているコンポーネント ドキュメントを設定または変更するには、次のようにします。

$MyXML = Get-Content <Filepath> | Out-String
Get-StorageSubSystem Cluster* | Set-StorageHealthSetting -Name "System.Storage.SupportedComponents.Document" -Value $MyXML

注意

モデル、製造元、およびファームウェアのバージョンのプロパティは、Get-PhysicalDisk コマンドレットで取得される値と完全に一致する必要があります。 こうしたプロパティは、ベンダーの実装によっては、ユーザーの "常識的な" 想定とは異なる可能性があります。 たとえば、製造元は "Contoso" ではなく "CONTOSO-LTD" である場合や、製造元は空白でモデルが "Contoso XZY9000" となっている場合があります。

次の PowerShell コマンドレットを使用して確認できます。

Get-PhysicalDisk | Select Model, Manufacturer, FirmwareVersion

ヘルス サービスの設定

ヘルス サービスの設定を変更して、障害やアクションの強度を調整したり、特定の動作をオンまたはオフにしたりできます。 「ヘルス サービスの設定を変更する」をご覧ください。

その他のリファレンス