Azure Stack Hub 用のストレージ インフラストラクチャを管理する

この記事では、Azure Stack Hub のストレージ インフラストラクチャ リソースの正常性状態と操作状態について説明します。 この種のリソースには、ストレージ ドライブとストレージ ボリュームがあります。 このトピックの情報は、プールにドライブを追加できないなど、さまざまな問題のトラブルシューティングを行うときに役に立ちます。

ボリュームの状態

ボリュームの状態を確認するには、次の PowerShell コマンドを使用します。

$scaleunit_name = (Get-AzsScaleUnit)[0].name

$subsystem_name = (Get-AzsStorageSubSystem -ScaleUnit $scaleunit_name)[0].name

Get-AzsVolume -ScaleUnit $scaleunit_name -StorageSubSystem $subsystem_name | Select-Object VolumeLabel, HealthStatus, OperationalStatus, RepairStatus, Description, Action, TotalCapacityGB, RemainingCapacityGB

デタッチされているボリュームと、デグレード状態または不完全な状態のボリュームを示す出力の例は次のとおりです。

VolumeLabel HealthStatus OperationalStatus
ObjStore_1 Unknown デタッチ
ObjStore_2 警告 {デグレード、Incomplete (不完全)}

以降のセクションでは、正常性状態と操作状態について説明します。

ボリュームの正常性状態:Healthy

操作状態 説明
[OK] ボリュームは正常な状態です。
Suboptimal (最適でない) データが複数のドライブに均等に書き込まれていません。

アクション: 記憶域プール内のドライブの使用を最適化するために、サポートにお問い合わせください。 それに先立って、 https://aka.ms/azurestacklogfiles に記載されているガイダンスを使用してログ ファイルの収集プロセスを開始してください。 失敗した接続を復元した後に、バックアップからの復元が必要になることがあります。

ボリュームの正常性状態:警告

ボリュームの正常性状態が警告のときは、データの 1 つ以上のコピーが利用不可能な状態になっているものの、Azure Stack Hub では依然としてデータの少なくとも 1 つのコピーを読み取れることを示します。

操作状態 説明
サービス中 ドライブを追加または削除した後などに、Azure Stack Hub がボリュームを修復している最中です。 修復が完了したら、ボリュームの正常性状態が [OK] に戻ります。

アクション: Azure Stack Hub がボリュームの修復を終えるまで待ち、修復が終わったら状態を確認します。
Incomplete (不完全) 障害が発生しているドライブや、見つからないドライブが 1 つ以上あるため、ボリュームの回復性が低下しています。 ただし、見つからないドライブにはデータの最新のコピーが格納されています。

アクション: 見つからなかったドライブを再接続し、障害が発生したドライブを交換します。また、オフラインになっているサーバーがあれば、オンラインに復帰させます。
低下しています 障害が発生しているドライブや、見つからないドライブが 1 つ以上あり、ドライブに格納されているデータのコピーも古くなっているため、ボリュームの回復性が低下しています。

アクション: 見つからなかったドライブを再接続し、障害が発生したドライブを交換します。また、オフラインになっているサーバーがあれば、オンラインに復帰させます。

ボリュームの正常性状態:異常

ボリュームの状態が [異常] のときは、ボリューム上のデータの一部または全部にアクセスできなくなっています。

操作状態 説明
No redundancy (冗長性なし) 障害が発生したドライブが多すぎるため、ボリュームからデータが失われました。

アクション: サポートにお問い合わせください。 それに先立って、 https://aka.ms/azurestacklogfiles に記載されているガイダンスを使用してログ ファイルの収集プロセスを開始してください。

ボリュームの正常性状態:Unknown

このほか、仮想ディスクがデタッチされた場合には、ボリュームの正常性が [不明] になることもあります。

操作状態 説明
デタッチ ストレージ デバイスの障害が発生しており、ボリュームにアクセスできなくなる可能性があります。 一部のデータが失われるおそれがあります。

アクション:
1.ストレージ デバイスすべてについて、物理的な接続状態とネットワーク接続の状況を確認します。
2.デバイスがすべて正しく接続できている場合は、サポートにお問い合わせください。 それに先立って、 https://aka.ms/azurestacklogfiles に記載されているガイダンスを使用してログ ファイルの収集プロセスを開始してください。 失敗した接続を復元した後に、バックアップからの復元が必要になることがあります。

ドライブの状態

ドライブの状態を監視するには、次の PowerShell コマンドを使用します。

$scaleunit_name = (Get-AzsScaleUnit)[0].name

$subsystem_name = (Get-AzsStorageSubSystem -ScaleUnit $scaleunit_name)[0].name

Get-AzsDrive -ScaleUnit $scaleunit_name -StorageSubSystem $subsystem_name | Select-Object StorageNode, PhysicalLocation, HealthStatus, OperationalStatus, Description, Action, Usage, CanPool, CannotPoolReason, SerialNumber, Model, MediaType, CapacityGB

以降のセクションでは、ドライブの正常性状態について説明します。

ドライブの正常性状態:Healthy

操作状態 説明
[OK] ボリュームは正常な状態です。
サービス中 ドライブ内部でハウスキープ処理を実行中です。 処理が完了したら、ドライブの正常性状態が [OK] に戻ります。

ドライブの正常性状態:警告

ドライブが [警告] 状態の場合には、データの読み取りと書き込みは正常に実行できるものの、ドライブに何らかの問題が発生しています。

操作状態 説明
通信の切断 ドライブへの接続が失われました。

アクション: サーバーをすべてオンラインに戻します。 問題が解決しない場合には、ドライブを再接続します。 この状態が続く場合には、回復性確保のためにドライブを交換します。
予測される障害 ドライブに間もなく障害が発生することが予想されます。

アクション: 回復性確保のために、できるだけ早くドライブを交換します。
IO エラー ドライブにアクセスする際に一時的なエラーが発生しました。

アクション: この状態が続く場合には、回復性確保のためにドライブを交換します。
一時的なエラー ドライブに一時的なエラーが発生しました。 このエラーは通常、ドライブから応答がないことを示していますが、記憶域スペース ダイレクトの保護パーティションがドライブから不適切に削除されたことを示している可能性もあります。

アクション: この状態が続く場合には、回復性確保のためにドライブを交換します。
Abnormal latency (待機時間の異常) ドライブが応答しないことがあり、障害の兆候が見られます。

アクション: この状態が続く場合には、回復性確保のためにドライブを交換します。
Removing from pool (プールから削除中) Azure Stack Hub では、記憶域プールからドライブが削除されています。

アクション: Azure Stack Hub でのドライブの削除が終わるまで待ち、削除が終わったら状態を確認します。
状態が変化しない場合は、サポートにお問い合わせください。 それに先立って、 https://aka.ms/azurestacklogfiles に記載されているガイダンスを使用してログ ファイルの収集プロセスを開始してください。
Starting maintenance mode (メンテナンス モードを起動中) Azure Stack Hub では、ドライブをメンテナンス モードに移行する処理が行われています。 この状態は一時的なものであり、ドライブの状態はすぐにメンテナンス モードになります。

アクション: Azure Stack Hub の処理が終わるまで待ち、その後で状態を確認します。
メンテナンス モード ドライブがメンテナンス モードになっており、ドライブからの読み取りと書き込みが停止しています。 この状態は通常、PNU や FRU などの Azure Stack Hub 管理タスクがドライブで行われていることを示します。 ただし、管理者もドライブをメンテナンス モードに移行させることができます。

アクション: Azure Stack Hub の管理タスクが終わるまで待ち、その後で状態を確認します。
状態が変化しない場合は、サポートにお問い合わせください。 それに先立って、 https://aka.ms/azurestacklogfiles に記載されているガイダンスを使用してログ ファイルの収集プロセスを開始してください。
Stopping maintenance mode (メンテナンス モードを停止中) Azure Stack Hub では、ドライブをオンラインに復帰させる処理が行われています。 この状態は一時的なものであり、ドライブはすぐに別の状態 (理想的には正常) に変わります。

アクション: Azure Stack Hub の処理が終わるまで待ち、その後で状態を確認します。

ドライブの正常性状態:異常

状態が [異常] のドライブには、書き込みまたはアクセスができません。

操作状態 説明
Split ドライブがプールから隔離されています。

アクション: ドライブを新しいディスクに交換します。 このディスクを使う必要がある場合は、ディスクをシステムから取り外したうえで、ディスクに有用なデータが一切ないことを確認してから、ディスクを消去し、同じディスクをもう一度取り付けます。
使用不可 物理ディスクがソリューション ベンダーによりサポートされていないため、ディスクが検疫されています。 サポートされるのは、ソリューションでの利用が承認され、正しいディスク ファームウェアを備えたディスクのみです。

アクション: ドライブを、ソリューションでの利用が承認されている製造元とモデルの番号を備えたディスクに交換します。
古いメタデータ 交換した新しいディスクは以前に使用されていたものであり、不明なストレージ システムのデータが残っている可能性があります。 ディスクは検疫されています。

アクション: ドライブを新しいディスクに交換します。 このディスクを使う必要がある場合は、ディスクをシステムから取り外したうえで、ディスクに有用なデータが一切ないことを確認してから、ディスクを消去し、同じディスクをもう一度取り付けます。
認識されないメタデータ 認識されないメタデータが見つかりました。これは通常、ドライブに別のプールのメタデータが存在することを示しています。

アクション: ドライブを新しいディスクに交換します。 このディスクを使う必要がある場合は、ディスクをシステムから取り外したうえで、ディスクに有用なデータが一切ないことを確認してから、ディスクを消去し、同じディスクをもう一度取り付けます。
エラーのあるメディア ドライブにエラーが発生したので、このドライブが今後記憶域スペースで使われることはありません。

アクション: 回復性確保のために、できるだけ早くドライブを交換します。
Device hardware failure (デバイスのハードウェア障害) このデバイスでハードウェア障害が発生しました。

アクション: 回復性確保のために、できるだけ早くドライブを交換します。
Updating firmware (ファームウェアを更新中) Azure Stack Hub でドライブのファームウェアが更新されています。 この状態は一時的なものであり、通常は 1 分未満で終了します。その間、読み取りと書き込みはすべて、プール内の別のドライブにより処理されます。

アクション: Azure Stack Hub の更新処理が終わるまで待ち、その後で状態を確認します。
開始中 ドライブが稼働開始のための準備をしている状態です。 この状態は一時的なものであり、準備が完了すると、ドライブは別の操作状態に移行します。

アクション: Azure Stack Hub の処理が終わるまで待ち、その後で状態を確認します。

ドライブをプールできない理由

一部のドライブは、Azure Stack Hub の記憶域プールに入れる準備ができていません。 ドライブをプールできない理由は、ドライブの CannotPoolReason プロパティを見ると確認できます。 次の表は、それぞれの理由をもう少し詳しく説明したものです。

理由 説明
Hardware not compliant (非準拠ハードウェア) ドライブが、ヘルス サービスを使用して指定された承認済みのストレージ モデルの一覧に存在しません。

アクション: ドライブを新しいディスクに交換します。
Firmware not compliant (非準拠ファームウェア) 物理ドライブ上のファームウェアが、ヘルス サービスを使用して指定された承認済みのファームウェア リビジョンの一覧に存在しません。

アクション: ドライブを新しいディスクに交換します。
In use by cluster (クラスターで使用中) ドライブが現在、フェールオーバー クラスターによって使用されています。

アクション: ドライブを新しいディスクに交換します。
リムーバブル メディア ドライブがリムーバブル ドライブとして分類されています。

アクション: ドライブを新しいディスクに交換します。
異常 ドライブが正常な状態にないため、交換が必要な可能性があります。

アクション: ドライブを新しいディスクに交換します。
Insufficient capacity (容量の不足) ドライブの空き領域を占有しているパーティションがあります。

アクション: ドライブを新しいディスクに交換します。 このディスクを使う必要がある場合は、ディスクをシステムから取り外したうえで、ディスクに有用なデータが一切ないことを確認してから、ディスクを消去し、同じディスクをもう一度取り付けます。
Verification in progress (検証中) ドライブまたはドライブ上のファームウェアの利用が承認されているかどうかについて、ヘルス サービスによる確認が進行中です。

アクション: Azure Stack Hub の処理が終わるまで待ち、その後で状態を確認します。
検証できませんでした ドライブまたはドライブ上のファームウェアの利用が承認されているかどうかについて、ヘルス サービスによる確認ができませんでした。

アクション: サポートにお問い合わせください。 それに先立って、 https://aka.ms/azurestacklogfiles に記載されているガイダンスを使用してログ ファイルの収集プロセスを開始してください。
オフライン ドライブがオフラインになっています。

アクション: サポートにお問い合わせください。 それに先立って、 https://aka.ms/azurestacklogfiles に記載されているガイダンスを使用してログ ファイルの収集プロセスを開始してください。