次の方法で共有


Azure の計画メンテナンス イベントからの影響を受けたリソース

影響を受けるリソースを表示するエクスペリエンスをサポートするために、Service Health には次の機能があります。

  • 計画メンテナンス イベントが原因で影響を受けたリソースを表示します。
  • Service Health ポータル経由で、計画メンテナンスの影響を受けるリソース情報を提供する。

この記事では、ユーザーに伝達される内容と、影響を受けたリソースに関する情報を表示できる場所について詳しく説明します。

Service Health ポータル内での計画メンテナンス イベントの影響を受けるリソースの表示

Azure portal の [サービスの正常性]> の下にある [影響を受けるリソース] タブに、計画メンテナンス イベントの影響を受けるリソースが表示されます。 次の [影響を受けるリソース] タブの例では、影響を受けるリソースを含む計画メンテナンス イベントが示されています。

Azure Service Health の計画メンテナンスの影響を受けたリソースのスクリーンショット。

Service Health では、計画メンテナンス イベントの影響を受けるリソースに関する次の情報が提供されます。

フィールド 説明
リソース名 計画メンテナンス イベントの影響を受けたリソースの名前。
リソースの種類 計画メンテナンス イベントの影響を受けたリソースの種類。
リソース グループ 影響を受けるリソースを含むリソース グループ。
リージョン 影響を受けるリソースを含むリージョン。
サブスクリプション ID 影響を受けたリソースを含むサブスクリプションの一意の ID。
アクション(*) Self-Service 期間中に適用された更新ページへのリンク (コンピューティング リソースの再起動可能な更新のみ)。
セルフサービス メンテナンス期限(*) ユーザーが更新プログラムを適用した場合の Self-Service ウィンドウの期限 (コンピューティング リソースでの再起動の更新のみ)。

アスタリスク * が付いたフィールドは、リソースの種類に応じて使用できる省略可能なフィールドです。

結果をフィルター処理する

顧客は、次のフィルターを使用して結果をフィルター処理できます。

  • リージョン: 影響を受けるリソースが配置されているリージョン。
  • サブスクリプション ID: ユーザーがアクセスできるすべてのサブスクリプション ID。
  • リソースの種類: ユーザー サブスクリプションのすべてのリソースの種類。

影響を受けるリソースの並べ替えに使用されるフィルターのスクリーンショット。

CSV ファイルにエクスポートする

このオプションをクリックすると、影響を受けるリソースの一覧を Excel ファイルとしてエクスポートできます。

CSV へのエクスポート ボタンのスクリーンショット。

CSV ファイルには、各イベントに関連付けられているプロパティと、イベント レベルごとの詳細が含まれます。 このファイルは、 Service Health>Planned メンテナンス ビューのすべてのアクティブなイベントの静的なポイントインタイム スナップショットとして使用できます。
これらの詳細は、Service Health API を通じて利用できるより多くのイベント レベル情報のサブセットであり、Event Grid やその他のイベント自動化ソリューションと統合できます。

[影響を受けるサービス] のスクリーンショット。

この表には、各列プロパティの簡単な説明が含まれています。

列プロパティ 説明
タイトル 公開されたイベントのタイトル。
TrackingId さまざまな Service Health カテゴリに関する各イベントの一意の識別子。
影響を受けるサービス 公開されたメンテナンス イベントに適用できる 1 つ以上のサービス。
影響の開始時刻 イベントの開始時刻 (UTC)。 更新のコミュニケーションを通じて共有される各イベント内には、より小さな作業期間または時間枠が存在する場合があります。
影響の終了時刻 イベントの終了時刻 (UTC)。 更新のコミュニケーションを通じて共有される各イベント内には、より小さな作業期間または時間枠が存在する場合があります。
サブスクリプション 発行されたイベントのスコープ内にある任意のSubscriptionId。
推定される影響期間* リソース レベルの影響の推定時間 (秒)。 イベント期間は、より広い期間 (数時間や場合によっては数日など) の場合があります。 ただし、このフィールドには、スケジュールされた期間内の推定される影響期間が表示されます。
影響の種類* イベント期間中、サービスまたはリソース レベルの影響を観察する方法に基づいてイベントを分類するのに役立つ、定義済みの影響の種類。 カテゴリの詳細については、次のセクションを参照してください。
推奨事項* 影響の種類に基づくユーザーの手順または推奨されるアクション。

アスタリスク * が付いたフィールドは新しく導入されたプロパティであり、新しいレイアウトをまだ採用していない一部のサービスでは空になる場合があります。

[メンテナンス影響のタイプフィールドと期間フィールド]

顧客への計画メンテナンス通知の信頼性と予測性を高める継続的な取り組みでは、特に、公開されたイベントへの影響の側面に関して、最近 3 つの新しいプロパティを追加しました。 現在、これらのプロパティは、CSV エクスポート オプションまたは Service Health API 呼び出しを通じて使用可能です。

私たちは、イベントの公開の一部としてこれらのフィールドを含めることができるサービスを増やしていますが、オンボーディング中のサービスのサブセットがあり、これらのフィールドがイベントに値を持たない可能性があります。

ホステッド サービスとエンド ユーザーへの影響

影響の種類プロパティは、この一般的な懸念に答えるキーです。 Azure Service Health ポータルには、メンテナンス イベント用の新しい [影響の種類] フィールドが含まれており、スケジュールされた時間内に予想される影響をすばやく表示します。

Azure サービス全体で異なる影響の症状をカバーまたは表すカテゴリの定義済みのセットがあります。 各サービスには、製品設計によって "影響" に関する固有の基準があるため、若干の重複がある可能性があります。

次の表は、Impact Type プロパティの使用可能な値に関する詳細な分析情報を提供します。 説明列には、停電、ブラウンアウト、グレーアウトなどの業界標準の用語とのマッピングが表示されます。

影響の種類のカテゴリ 説明 例:
サービスの可用性 #Blackout#Impactful、#ServicePaused、#TempStorageLoss

リソースまたはサービスが短時間、一時停止の状態です。 このカテゴリ下のイベントは、リソースの全体的な可用性やユーザー接続に一時的に影響する場合があります。
ネットワーク: 仮想マシン (VM) がネットワーク接続を失ったり、既存の接続が終了したりする可能性があります。

コンピューティング (VM): VM の応答時間と接続に影響を与える、仮想コア (CPU) 上での一時的な停止またはフリーズ。 強制更新中またはホストの正常性低下中のサービス回復プロセスは、もう 1 つの一般的なシナリオです。

ストレージ: ディスク IO での完全なまたは一時的な停止 (ドライバーの更新、ストレージ エージェントの更新など)。

SQL: クエリの応答時間とデータベース接続の短時間の損失に影響する、メンテナンスの再構成による SQL データベースへの一時的な影響。 実行時間の長いクエリが中断され、再起動が必要になる場合があります。
パフォーマンスの低下 #Brownout#ModerateImpact、#Latency、#IntermittentTimeouts、#Slowness、#VMStatePreserved

症状は、サービスまたは製品ごとに異なる場合があります。 SQL Apps などの一部では、待機時間や遅い応答時間が、ユーザーや実行中のクエリに対してより明白になる場合があります。
リソースは通常稼働していますが、機能が低下しているか、機能が制限されています。 機密性の高いワークロードではより顕著になります。
ネットワーク: 接続の低下が目に見えるので、断続的なタイムアウトまたは切断が発生します。 ディスク ドライブにアクセス中の応答時間の遅延 (たとえば、更新中に高速ネットワーク機能が一時停止する場合があります)。 断続的なパケット損失。

コンピューティング (VM): "ライブ マイグレーション" アクティビティ。 アプリケーションまたはユーザーの処理が目に見えて遅くなる場合があります。 もう 1 つのシナリオは、最大 9 秒間、低下した接続を観察する NIC リセットが発生している場合です。

ストレージ: ディスク IOPS が低下する場合があります。

SQL: DB 待機時間要求では、読み取り操作または書き込み操作で遅延または失敗が発生する可能性があります。
ネットワーク接続 #Grayout#ModerateImpact、#ConnectionTimeouts、#RetriesSucceed

ネットワーク スタックに関連するイベントによる、ユーザーへの中程度の影響。 アーキテクチャ設計ごとに冗長レイヤーが組み込まれているため、影響期間が短くなり、全体的な影響は最小限に抑えられます。
これらのタイムアウトは、T0、T1、NIC、または NMAgent のアップグレードや、リージョンまたはゾーンのネットワーク ケーブルとスイッチに関連するイベントの場合があります。
ネットワーク: 既存の接続は引き続き動作しますが、新しい接続を確立できません (たとえば、VFP の更新中に発生する場合があります)。
ToR (Top of Rack) デバイス関連のメンテナンスの一部は、このカテゴリに分類されます。
リソース利用不可 #Impactful、#Reboot、#Restart、#Redeploy、#Shutdown、#NoConnectivity、#Downtime

リソースのダウンタイムが比較的長いイベント (たとえば、VM の場合は > 30 秒)。 サービスまたはリソースが、ユーザーやアプリケーションには利用不可の場合があります。 新しいプラットフォーム設計のイノベーションにより、このカテゴリのイベントの頻度は大幅に減少しています。
コンピューティング: VM の再起動または再起動。 一時ストレージ上のデータが失われる場合があります。
再起動 (強制)、再デプロイ、VM の停止と起動などの操作は、このシナリオの一般的な例です。
VM の管理メンテナンスの開始は再デプロイを構成するため、このカテゴリに分類されます。
データの可用性 #グレーアウト#フェイルオーバー#適度な影響、#接続タイムアウト、#クエリタイムアウト、#再試行成功

SQL スイートのアプリに適用されます。 ユーザーへの影響は最小限であり、フェールオーバーが発生している間にのみ起こります。
SQL: メンテナンス イベントでは、メンテナンス イベント開始時のプライマリおよびセカンダリ レプリカの配置に応じて、1 回または複数回の再構成またはフェールオーバーが発生する場合があります。 平均の影響期間は数秒です。 既に接続されている場合は、アプリケーションを再接続する必要があり、実行時間の長いクエリが中断される可能性があり、再起動が必要になる場合があります。
予想される影響なし #NoImpact#Impactless 目立つ影響はありません。

ネットワーク: たとえば、通常、ファイバー ケーブル メンテナンス イベントでは、トラフィックが再ルーティングされる短い時間を除いて、大きな問題は発生しません。これにより、パケットが軽微で一時的に失われる可能性があります。 ただし、通常、これらのパケットは正常に再試行されます。
その他 (詳細についてはメッセージを参照してください) これらのカテゴリのいずれも直接適用されない場合、または上記のカテゴリの 1 つ以上が適用される場合は、メッセージ内容の中に詳細が提供されます。 複数の影響カテゴリが適用されます。

影響期間

[影響期間] フィールドには、一覧化されたリソースにイベントが影響を与える時間を、秒単位で表した数値が表示されます。 サービスの回復性と実装の設計に応じて、この [期間] フィールドと [影響の種類] フィールドを組み合わせることで、ユーザーが全体的な影響のレベルを予測するのに役立ちます。

注意する重要な側面の 1 つは、イベント開始時刻/終了時刻と期間の違いです。 開始/終了時刻など、イベント レベルのフィールドはスケジュールされた作業期間を表しますが、[影響期間] フィールドは、スケジュールされた作業期間内の実際の "ダウンタイム" を表します。

次のステップ