為 Azure SQL Database 和 Azure SQL 受控執行個體使用資源健康狀態,針對其連線能力進行疑難排解

適用于:Azure SQL資料庫 Azure SQL 受控執行個體

適用於 Azure SQL Database 和 Azure SQL 受控執行個體的資源健康狀態可協助您進行診斷,並在 Azure 問題影響您的 SQL 資源時取得支援。 它會通知您資源的目前及過去的健康狀態,並協助您解決問題。 資源健康狀態會在您需要解決 Azure 服務問題時提供技術支援。

概觀

健康狀態檢查

資源健康情況會藉由檢查是否成功登入資源,來判斷 SQL 資源的健康情況。 適用於 SQL Database 資源的資源健康狀態,目前僅會檢查系統錯誤導致的登入失敗,而不會檢查肇因於使用者錯誤的登入失敗。 資源健康狀態每 1 到 2 分鐘會更新一次。

健康狀態

可用

若為可用狀態,則表示資源健康狀態尚未在 SQL 資源上偵測到系統錯誤導致的登入失敗。

可用

已降級

若狀態為 [已降級],表示資源健康情況大多偵測到成功的登入,但也有一些失敗。 這些很可能是暫時性的登入錯誤。 若要減少暫時性登入錯誤導致的連線問題影響,請在程式碼中實作重試邏輯

已降級

[無法使用]

若狀態為 [無法使用],表示資源健康情況偵測到持續性的 SQL 資源登入失敗。 如果您的資源長時間處於此狀態,請連絡支援人員。

[無法使用]

Unknown

[不明] 健康狀態表示資源健康狀態超過 10 分鐘未收到此資源的相關資訊。 雖然此狀態並非資源狀態的明確指示,卻是疑難排解程序中的重要資料點。 如果資源如預期般執行,幾分鐘後資源的狀態會變更為 [可用]。 如果您遇到資源問題,[不明] 健康狀態可能暗示資源受到平台事件影響。

Unknown

歷程記錄資訊

您可以在資源健康狀態的 [健康情況歷程記錄] 區段中,存取最多 14 天的健康情況歷程記錄。 此區段也會針對資源健康情況所報告的停止運作狀況,顯示停止運作的原因 (如果有的話)。 Azure 目前會以兩分鐘為單位,顯示資料庫資源的停機時間。 實際的停止運作時間可能少於一分鐘。 平均時間是 8 秒。

停止運作的原因

當您的資料庫發生停機狀況時,系統會執行分析以判斷原因。 找到的停止運作原因會報告在 [資源健康狀態] 的 [健康情況歷程記錄] 區段中。 停機原因通常會在事件發生後的 45 分鐘內發佈。

預定的維修

Azure 基礎結構會定期執行計劃性維護 – 資料中心的軟硬體元件升級。 在資料庫進行維護的期間,Azure SQL 可能會終止某些現有的連線,並拒絕新連線。 在計劃性維護期間發生的登入失敗通常是暫時性的,重試邏輯可有效降低其影響。 如果持續發生登入錯誤,請連絡支援人員。

Reconfiguration

重新設定會視為暫時性的狀況,且會時常發生。 負載平衡或軟體/硬體失敗都可能觸發這些事件。 任何連線到雲端資料庫的用戶端生產應用程式均應實作健全的連線重試邏輯,因為這有助於減輕這些狀況的影響,且通常會讓使用者更清楚了解這些錯誤。

後續步驟