為 Azure SQL 資料庫使用資源健康狀態,針對其連線能力進行疑難排解

適用於:Azure SQL Database

Azure SQL 資料庫的資源健康狀態可協助您進行診斷,並在 Azure 問題影響您的資源時取得支援。 它會通知您資源的目前及過去的健康狀態,並協助您解決問題。 資源健康狀態可在您需要協助以解決 Azure 服務問題時提供技術支援。

Screenshot of the Azure portal showing the Resource Health page for an Azure SQL Database.

健康狀態檢查

資源健康狀態會藉由檢查是否成功登入資源,來判斷 SQL Database 資源的健康情況。 適用於 SQL Database 資源的資源健康狀態,目前僅會檢查系統錯誤導致的登入失敗,而不會檢查肇因於使用者錯誤的登入失敗。 健康狀態每 1 到 2 分鐘會更新一次。

健康狀態

可用

[可用] 狀態表示資源健康狀態未偵測到您的 SQL Database 發生系統錯誤,或存在某些登入失敗,但未達到警示閾值。 下列各節提供了關於警示閾值的更多詳細資料。

Screenshot of the Azure portal showing the status message for the state of Available.

已降級

狀態為 [已降級] 表示,在過去三分鐘內,偵測到資源健康狀態

  • 大部分成功登入,但有多次登入失敗 (由於系統錯誤) 或
  • 多次登入失敗 (由於系統錯誤),但登入嘗試總數少於六次。

這些很可能是暫時性的登入錯誤。 若要減少暫時性登入錯誤導致的連線問題影響,請在程式碼中實作重試邏輯

Screenshot of the Azure portal showing the status message for the state of Degraded.

[無法使用]

狀態為 [無法使用] 表示資源健康狀態偵測到最後一分鐘有超過五次登入嘗試,且超過四分之一的登入嘗試因系統原因而失敗。 如果您的資源長時間處於此狀態,請連絡 Microsoft 支援服務。

Screenshot of the Azure portal showing the status message for the state of Unavailable.

Unknown

不明健康狀態表示資源健康狀態超過 10 分鐘未收到此資源的相關資訊。 雖然此狀態並非資源狀態的明確指示,卻是疑難排解程序中的重要資料點。 如果資源如預期般執行,幾分鐘後資源的狀態會變更為 [可用]。 如果您遇到資源問題,[不明] 健康狀態可能暗示資源受到平台事件影響。

Screenshot of the Azure portal showing the status message for the state of Unknown.

警示時間

資源健康狀態警示顯示的時間不會與造成警示的登入失敗時間保持一致。 這是因為需要幾分鐘的時間才能收集和分析遙測,以確定是否有資源健康狀態問題。 因此,在登入失敗後,資源健康狀態警示中指出的時間將會是幾分鐘。

此外,登入失敗發生的時間間隔通常比資源健康狀態警示中的時間間隔短。

歷程記錄資訊

您可以在資源健康狀態的 [健康狀態歷程記錄] 區段中,存取最多 30 天的健康狀態歷程記錄。 此區段也包含停機的原因 (可用時)。 Azure 目前會以兩分鐘為單位,顯示資料庫資源的停機時間。 實際的停止運作時間可能少於一分鐘。 平均時間是 8 秒。

停止運作的原因

當您的資料庫發生停機狀況時,系統會執行分析以判斷原因。 找到的停止運作原因會報告在 [資源健康狀態] 的 [健康狀態歷程記錄] 區段中。 停機原因通常會在事件發生後的 45 分鐘內發佈。

選取維護時段

您可以設定維護時段,讓對工作負載會產生影響的維修事件可預測且較不具干擾性。 維護時段功能可協助您規劃可預測的升級或排程維護。 事先通知可用於設定為使用非預設維護視窗的資料庫。 事先通知可讓客戶將通知設定為在任何計劃性事件前最多 24 小時傳送。

預定的維修

Azure 基礎結構會定期執行計劃性維護 – 資料中心的軟硬體元件升級。 在資料庫進行維護的期間,Azure SQL 會終止某些現有的連線,並拒絕新連線。 在計劃性維護期間發生的登入失敗通常是暫時性的,針對偶爾出現之網路錯誤的重試邏輯有助於降低其影響。 如果持續發生登入錯誤,請連絡支援人員。

Reconfiguration

重新設定會視為暫時性的狀況,且會時常發生。 負載平衡或軟體/硬體失敗都可能觸發這些事件。 任何連線到雲端資料庫之用戶端生產應用程式均應實作健全的連線針對暫時性錯誤之重試邏輯,因為這有助於減輕這些狀況的影響,且通常會讓使用者更清楚了解這些錯誤。