共用方式為


針對代理程式或擴充功能問題造成的 Azure 備份失敗進行疑難排解

本文提供的疑難排解步驟可協助您解決與 VM 代理程式及擴充功能通訊相關的 Azure 備份錯誤。

若本文中未提及您的 Azure 問題,請前往 Microsoft Q&A 及 Stack Overflow 上的 Azure 論壇。 您可以在這些論壇中張貼您的問題,或將問題貼到 Twitter 上的 @AzureSupport。 您也可以提交 Azure 支援要求。 若要提交支援要求,請在 [Azure 支援] 頁面選取 [取得支援]

針對備份失敗進行疑難排解的逐步指南

您可遵循下列疑難排解步驟,自行解決大部分常見的備份失敗問題:

步驟 1:檢查 Azure VM 健康情況

  • 確定 Azure VM 佈建狀態為「執行中」:如果 VM 佈建狀態處於已停止/解除配置/更新狀態,則會干擾備份作業。 開啟 [Azure 入口網站] > [VM] > [概觀]>,然後檢查 VM 狀態,確認其為執行中,然後重試備份作業。
  • 檢查擱置的 OS 更新或重新開機:確認 VM 上沒有擱置的 OS 更新或擱置的重新開機。

步驟 2:檢查 Azure VM 客體代理程式服務健康狀態

步驟 3:檢查 Azure VM 擴充功能健康情況

  • 確認所有 Azure VM 擴充功能皆處於「佈建成功」狀態:如果有任何擴充功能處於失敗狀態,則可能會干擾備份。
  • 開啟 Azure 入口網站 > [VM] > [設定] > [擴充功能] > [擴充功能狀態],檢查是否所有擴充功能皆處於佈建成功狀態。
  • 確認所有擴充功能問題皆已解決,然後重試備份作業。
  • 確認 COM+ System Application 已啟動且正在執行。 此外,分散式交易協調器服務應以網絡服務帳戶身分執行。 遵循本文中的步驟,針對 COM+ 和 MSDTC 問題進行疑難排解

步驟 4:檢查 Azure 備份擴充功能健康情況

Azure 備份會使用 VM 快照集擴充功能,擷取 Azure 虛擬機器的應用程式一致備份。 Azure 備份會在啟用備份後觸發的第一次排程備份中,安裝此擴充功能。

  • 確認 VMSnapshot 擴充功能並未處於失敗狀態:遵循本節所列的步驟,驗證並確保 Azure 備份擴充功能的健康情況良好。

  • 檢查擴充功能是否遭到防毒軟體封鎖:某些防毒軟體可能會阻止擴充功能執行。

    備份失敗時,請在事件檢視器的應用程式記錄中檢查是否有發生失敗的應用程式名稱:IaaSBcdrExtension.exe 記錄項目。 如果您看到這些項目,則可能是 VM 中設定的防毒軟體限制了備份擴充功能的執行。 在防毒軟體設定中排除下列目錄,然後重試備份作業。

    • C:\Packages\Plugins\Microsoft.Azure.RecoveryServices.VMSnapshot
    • C:\WindowsAzure\Logs\Plugins\Microsoft.Azure.RecoveryServices.VMSnapshot
  • 檢查是否需要網路存取權:擴充功能套件會從 Azure 儲存體擴充功能存放庫下載,而擴充功能狀態上傳則會發佈至 Azure 儲存體。 了解詳情

    • 如果您使用不受支援的代理程式版本,則必須允許 VM 對該區域的 Azure 儲存體進行輸出存取。
    • 如果您使用客體防火牆或 Proxy 封鎖了對 168.63.129.16 的存取,則不論是否存在上述情況,擴充功能都會失敗。 需要使用連接埠 80、443 和 32526。深入了解
  • 確認客體 VM 內部已啟用 DHCP:這是從 DHCP 取得主機或網狀架構位址,使 IaaS VM 備份能夠正常運作的必要條件。 如果您需要靜態私人 IP,則應透過 Azure 入口網站或 PowerShell 進行設定,並確保 VM 內部的 DHCP 選項已啟用。深入了解

  • 確認 VSS 寫入器服務已啟動且正在執行中:請遵循以下步驟,針對 VSS 寫入器問題進行疑難排解

  • 遵循備份最佳做法指導方針:檢閱啟用 Azure VM 備份的最佳做法

  • 檢閱加密磁碟指導方針:如果您要為具有加密磁碟的 VM 啟用備份,請確保您已提供所有必要的權限。 若要深入了解,請參閱備份及還原加密的 Azure VM

UserErrorGuestAgentStatusUnavailable - VM 代理程式無法與 Azure 備份通訊

錯誤碼:UserErrorGuestAgentStatusUnavailable
錯誤訊息:VM 代理程式無法與 Azure 備份通訊

Azure VM 代理程式可能已停止、過期、處於不一致狀態或尚未安裝。 這些狀態會導致 Azure 備份服務無法觸發快照集。

  • 開啟 Azure 入口網站 > [VM] > [設定] > [屬性] 窗格>,確認 VM 的 [狀態][執行中],且 [代理程式狀態][就緒]。 如果 VM 代理程式已停止或處於不一致狀態,請重新啟動代理程式
    • 針對 Windows VM,請遵循這些步驟來重新啟動客體代理程式。
    • 針對 Linux VM,請遵循這些步驟來重新啟動客體代理程式。
  • 開啟 Azure 入口網站 > [VM] > [設定] > [擴充功能]>,確認所有擴充功能皆處於 [佈建成功] 狀態。 如果並非如此,請遵循這些步驟來解決問題。

GuestAgentSnapshotTaskStatusError - 無法與 VM 代理程式通訊以取得快照集狀態

錯誤碼:GuestAgentSnapshotTaskStatusError
錯誤訊息:無法與 VM 代理程式通訊來取得快照集狀態

在您為 Azure 備份服務註冊 VM 並排程備份後,備份服務就會與 VM 備份擴充功能通訊,以擷取時間點快照集,藉此啟動作業。 下列任一情況都可能導致無法觸發快照集。 如果未觸發快照集,可能會導致備份失敗。 請依序完成下列疑難排解步驟,然後重試作業:

原因 1:代理程式已安裝在 VM 中,但沒有回應 (適用於 Windows VM)

原因 2︰安裝在 VM 中的代理程式已過時 (適用於 Linux VM)

原因 3︰無法擷取快照集狀態,或無法取得快照集

原因 4:未設定 VM 代理程式組態選項 (適用於 Linux VM)

原因 5:應用程式控制解決方案封鎖了 IaaSBcdrExtension.exe

UserErrorVmProvisioningStateFailed - VM 處於佈建失敗狀態

錯誤碼:UserErrorVmProvisioningStateFailed
錯誤訊息:VM 處於佈建失敗狀態

當其中一個擴充功能失敗,導致 VM 進入佈建失敗狀態時,就會發生此錯誤。
開啟 Azure 入口網站 > [VM] > [設定] > [擴充功能] > [擴充功能狀態],檢查是否所有擴充功能皆處於佈建成功狀態。 若要深入了解,請參閱佈建狀態

  • 如果有任何擴充功能處於失敗狀態,則可能會干擾備份。 確認這些擴充功能問題皆已解決,然後重試備份作業。
  • 如果 VM 佈建狀態處於更新中狀態,可能會干擾備份。 請確認其健康情況良好,然後重試備份作業。

UserErrorRpCollectionLimitReached - 已達到還原點集合上限

錯誤碼:UserErrorRpCollectionLimitReached
錯誤訊息:已達到還原點集合上限。

  • 如果復原點資源群組已鎖定而使復原點無法自動清除,就可能會發生此問題。
  • 如果每日觸發多個備份,也會發生此問題。 目前,我們建議每日只能有一個備份,因為即時還原點會根據已設定的快照集保留期保留 1-5 天,且任一指定的時間內只能讓 18 個即時 RP 與 VM 相關聯。
  • 一個 VM 在所有還原點集合與資源群組中的還原點數量不能超過 18 個。 若要建立新的還原點,請刪除現有的還原點。

建議的動作:
若要解決此問題,請移除 VM 資源群組的鎖定,並重試此作業以觸發清除。

附註

備份服務會建立一個不同於 VM 資源群組的獨立資源群組,用於儲存還原點集合。 建議不要鎖定建立給備份服務使用的資源群組。 備份服務建立的資源群組命名格式為:AzureBackupRG_<Geo>_<number>。 例如:AzureBackupRG_northeurope_1

步驟 1:移除還原點資源群組的鎖定
步驟 2:清除還原點集合

UserErrorKeyvaultPermissionsNotConfigured - 備份沒有足夠的金鑰保存庫權限可以進行加密 VM 的備份

錯誤碼:UserErrorKeyvaultPermissionsNotConfigured
錯誤訊息:備份沒有足夠的金鑰保存庫權限可以進行加密 VM 的備份。

若要成功備份加密的 VM,該備份作業必須具有存取金鑰保存庫的權限。 權限可透過 Azure portal/ PowerShell/ CLI 進行設定。

附註

如果已設定存取金鑰保管庫所需的權限,請在稍後重試此作業。

ExtensionSnapshotFailedNoNetwork - 快照集作業因虛擬機器沒有網路連線而失敗

錯誤碼:ExtensionSnapshotFailedNoNetwork
錯誤訊息:快照集作業因虛擬機器沒有網路連線而失敗

在您為 Azure 備份服務註冊 VM 並排程備份後,備份服務就會與 VM 備份擴充功能通訊,以擷取時間點快照集,藉此啟動作業。 下列任一情況都可能導致無法觸發快照集。 如果未觸發快照集,可能會導致備份失敗。 請完成下列疑難排解步驟,然後重試作業:

無法擷取快照集狀態,或無法取得快照集

ExtensionOperationFailedForManagedDisks - VMSnapshot 擴充功能作業失敗

錯誤碼:ExtensionOperationFailedForManagedDisks
錯誤訊息:VMSnapshot 擴充功能作業失敗

在您為 Azure 備份服務註冊 VM 並排程備份後,備份服務就會與 VM 備份擴充功能通訊,以擷取時間點快照集,藉此啟動作業。 下列任一情況都可能導致無法觸發快照集。 如果未觸發快照集,可能會導致備份失敗。 請依序完成下列疑難排解步驟,然後重試作業:原因 1:無法擷取快照集狀態,或無法取得快照集原因 2:代理程式已安裝在 VM 中,但沒有回應 (適用於 Windows VM)原因 3:安裝在 VM 中的代理程式已過時 (適用於 Linux VM)

BackUpOperationFailed / BackUpOperationFailedV2 - 備份失敗,發生內部錯誤

錯誤碼:BackUpOperationFailed / BackUpOperationFailedV2
錯誤訊息:備份因為內部錯誤而失敗 - 請在幾分鐘後重試作業

在您為 Azure 備份服務註冊 VM 並排程備份後,備份服務就會與 VM 備份擴充功能通訊,以擷取時間點快照集,藉此起始作業。 下列任一情況都可能導致無法觸發快照集。 如果未觸發快照集,可能會導致備份失敗。 請依序完成下列疑難排解步驟,然後重試作業:

UserErrorUnsupportedDiskSize - Azure 備份目前不支援所設定的磁碟大小

錯誤碼:UserErrorUnsupportedDiskSize
錯誤訊息:Azure 備份目前不支援所設定的磁碟大小。

備份磁碟大小超過 32 TB 的 VM 時,備份作業可能會失敗。 此外,目前不支援備份大小超過 4 TB 的加密磁碟。 請透過分割磁碟,確保磁碟大小未超過或等於支援的上限。

UserErrorBackupOperationInProgress - 無法起始備份,因為另一個備份作業正在進行中。

錯誤碼:UserErrorBackupOperationInProgress
錯誤訊息:無法起始備份,因為另一個備份作業正在進行中。

您最近的備份作業失敗,因為已有備份作業正在進行中。 您必須等到目前的作業完成,才能啟動新的備份作業。 請確定目前正在進行的備份作業已完成,再觸發或排定其他備份作業。 若要檢查備份作業狀態,請執行下列步驟:

  1. 登入 Azure 入口網站,選取 [所有服務]。 輸入「復原服務」,然後選取 [復原服務保管庫]。 復原服務保存庫清單隨即出現。
  2. 在復原服務保存庫清單中,選取已設定備份的保存庫。
  3. 在 [保存庫儀表板] 功能表中,選取 [備份作業] 以顯示所有備份作業。
    • 如果有正在進行中的備份作業,請等到該作業完成或取消備份作業。
      • 若要取消備份作業,請以滑鼠右鍵按一下備份作業,然後選取 [取消],或使用 PowerShell
    • 如果您已在不同的保存庫中重新設定備份,請確認舊的保管庫中沒有正在執行的備份作業。 如果有的話,請取消該備份作業。
      • 若要取消備份作業,請以滑鼠右鍵按一下備份作業,然後選取 [取消],或使用 PowerShell
  4. 請重試備份作業。

如果排定的備份作業費時過久,與下一個備份設定發生衝突,請檢閱最佳做法備份效能還原考量

UserErrorCrpReportedUserError - 備份因錯誤而失敗。 如需詳細資訊,請參閱作業錯誤訊息詳細資料

錯誤碼:UserErrorCrpReportedUserError
錯誤訊息:發生錯誤,導致備份失敗。 如需詳細資訊,請參閱作業錯誤訊息詳細資料。

此錯誤是由 IaaS VM 回報。 若要識別問題的根本原因,請前往復原服務保管庫設定。 在 [監視] 區段下方,選取 [備份作業] 以篩選並檢視狀態。 選取 [失敗],以檢閱基礎錯誤訊息詳細資料。 根據錯誤詳細資料頁面中的建議,採取進一步的動作。

UserErrorBcmDatasourceNotPresent - 備份失敗:此虛擬機器未受到 Azure 備份的 (主動) 保護

錯誤碼:UserErrorBcmDatasourceNotPresent
錯誤訊息:備份失敗:此虛擬機器未受到 Azure 備份的 (主動) 保護。

檢查指定的虛擬機器是否受到 Azure 備份的主動 (未處於暫停狀態) 保護。 若要解決此問題,請確保虛擬機器處於主動狀態,然後重試作業。

UserErrorConnectivityDnsResolutionFailure - 因 DNS 導致的連線問題

錯誤碼UserErrorConnectivityDnsResolutionFailure

錯誤訊息:操作失敗,因為 Azure Backup 工作負載擴充因 DNS 解析失敗無法連接到所需的 Azure 端點。

原因:當虛擬機無法解析所需的 Azure Backup 服務端點的網域名稱系統(DNS)名稱時,會發生此錯誤。

建議行動:要解決此問題,請遵循以下步驟:

  1. 驗證 DNS 解析:確保為虛擬機設定的 DNS 解決方案(Azure DNS 或自訂 DNS)能正確解析公開的 Azure 端點。
  2. 檢查私人端點:如果你使用私有端點管理復原服務保險庫,請確保在你的私人 DNS 區域中已設定所需的 DNS 紀錄。 缺少條目常會導致此錯誤。 若要列出並驗證必要的 DNS 條目,請參閱 私有端點 DNS 要求
  3. 驗證網路存取:檢查網路安全群組(NSG)或防火牆是否阻擋出站 DNS 流量(UDP/TCP 埠 53)或存取所需的 Azure 備份與儲存服務標籤。
  4. 測試連線能力:在 VM 中,使用 nslookupTest-NetConnection 解析保管庫與儲存體 URL。 確保 URL 指向正確的 IP 位址(如果使用私有端點則是內部 IP,否則是公開 IP)。

原因和解決方案

代理程式已安裝在 VM 中,但沒有回應 (適用於 Windows VM)

此錯誤的解決方案

VM 代理程式可能已損毀,或服務可能已停止。 重新安裝 VM 代理程式有助於取得最新版本。 這也有助於重新啟動與服務的通訊。

  1. 判斷 Windows Azure 客體代理程式服務是否在 VM 服務 (services.msc) 中執行。 請嘗試重新啟動 Windows Azure 客體代理程式服務並啟動備份。

    顯示如何開啟 Windows 服務的螢幕擷取畫面。

    顯示 Windows Azure 客體服務處於執行中狀態的螢幕擷取畫面。

  2. 如果服務中看不到 Windows Azure 客體代理程式服務,請在 [控制台] 中移至 [程式和功能],以判斷是否已安裝 Windows Azure 客體代理程式服務。

  3. 如果 Windows Azure Guest Agent 顯示在 [程式和功能] 中,請解除安裝 Windows Azure 客體代理程式。

  4. 下載並安裝最新版本的代理程式 MSI。 您必須擁有系統管理員權限,才能完成安裝。

  5. 確認 Windows Azure 客體代理程式服務顯示在服務中。

  6. 執行隨選備份:

    • 在入口網站中,選取 [立即備份]

此外,請確認 VM 中已安裝 Microsoft .NET 4.5。 VM 代理程式需要 .NET 4.5 才能與服務通訊。

安裝在 VM 中的代理程式已過時 (適用於 Linux VM)

解決方法

Linux VM 大多數與代理程式或擴充功能相關的失敗,都是由於對過時 VM 代理程式造成影響的問題所導致。 若要針對此問題進行疑難排解,請遵循下列一般指導方針:

  1. 遵循更新 Linux VM 代理程式的指示。

    附註

    強烈建議您僅透過散發套件存放庫更新代理程式。 不建議直接從 GitHub 下載代理程式的程式碼,並進行更新。 如果您的散發套件沒有最新的代理程式,請聯絡散發套件支援,以取得安裝指示。 若要檢查最新版本的代理程式,請前往 GitHub 存放庫中的 Windows Azure Linux 代理程式頁面。

  2. 執行下列命令,確認 Azure 代理程式正在 VM 上執行:ps -e

    如果程序未執行,請使用下列命令重新啟動:

    • 若為 Ubuntu/Debian:

         sudo systemctl restart walinuxagent
      
    • 針對其他散發套件︰

         sudo systemctl restart waagent
      
  3. 設定自動重新啟動代理程式

  4. 執行新的測試備份。 如果失敗仍然存在,請從 VM 收集下列記錄:

    • /var/lib/waagent/*.xml
    • /var/log/waagent.log
    • /var/log/azure/*

如果您需要 waagent 的詳細資訊記錄,請依照下列步驟操作:

  1. 在 /etc/waagent.conf 檔案中,找出下列這一行:Enable verbose logging (y|n)
  2. Logs.Verbose 值從 n 變更為 y
  3. 儲存變更,然後完成本節先前描述的步驟,以重新啟動 waagent。

未設定 VM 代理程式組態選項 (適用於 Linux VM)

組態檔 (/etc/waagent.conf) 會控制 waagent 的動作。 設定檔選項 Extensions.Enable 應設為 y,且 Provisioning.Agent 應設為 auto,備份才能運作。 如需 VM 代理程式組態檔選項的完整清單,請參閱 https://github.com/Azure/WALinuxAgent#configuration-file-options

應用程式控制解決方案封鎖了 IaaSBcdrExtension.exe

如果您正在執行 AppLocker (或其他應用程式控制解決方案),且規則是基於發行者或路徑,則這些規則可能會封鎖 IaaSBcdrExtension.exe,造成此執行檔無法執行。

此問題的解決方案

從 AppLocker (或其他應用程式控制軟體) 中排除 /var/lib 路徑或 IaaSBcdrExtension.exe 執行檔。

無法擷取快照集狀態,或無法取得快照集

VM 備份仰賴向基礎儲存體帳戶發出快照集命令。 無權存取儲存體帳戶或是快照集工作延遲執行,都可能導致備份失敗。

此問題的解決方案

下列情況可能會導致快照集工作失敗:

原因 解決方法
由於 VM 是在遠端桌面通訊協定 (RDP) 中關閉,導致回報的 VM 狀態不正確。 如果您是在 RDP 中關閉 VM,請檢查入口網站以判斷 VM 狀態是否正確。 如果不正確,請使用 VM 儀表板上的 [關機] 選項,在入口網站中關閉 VM。
VM 無法從 DHCP 取得主機或網狀架構位址。 必須在客體內啟用 DHCP,IaaS VM 備份才能運作。 如果 VM 無法從 DHCP 回應 245 取得主機或網狀架構位址,則無法下載或執行任何擴充功能。 如果您需要靜態私人 IP,則應透過 Azure 入口網站PowerShell 進行設定,並確保 VM 內部的 DHCP 選項已啟用。 深入了解如何使用 PowerShell 設定靜態 IP 位址。

移除復原點資源群組的鎖定

  1. 登入 Azure 入口網站

  2. 前往 [所有資源] 選項,選取格式為 AzureBackupRG_<Geo>_<number> 的還原點集合資源群組。

  3. [設定] 區段中,選取 [鎖定] 以顯示鎖定項目。

  4. 若要移除鎖定,請選取省略符號,然後選取 [刪除]

    顯示如何刪除鎖定的螢幕擷取畫面。

清除還原點集合

移除鎖定後,必須清除還原點。

如果您刪除 VM 的資源群組或 VM 本身,受控磁碟的立即還原快照集仍會保持作用中狀態,並根據設定的保留期過期。 若要刪除儲存在「還原點集合」中的立即還原快照集 (如果您不再需要),請依照下列步驟清除還原點集合。

若要清除還原點,請遵循下列任一方法:

執行隨選備份,以清除還原點集合

移除鎖定後,觸發隨選備份。 此動作可確保自動清除還原點。 請預期此隨選作業第一次執行時會失敗。 然而,這能確保還原點將會自動清除,而不用手動刪除。 完成清除之後,下一次排定的備份應會順利完成。

附註

自動清除會在觸發隨選備份後的幾個小時內發生。 如果排程的備份仍然失敗,請嘗試使用此處列出的步驟手動刪除還原點集合。

從 Azure 入口網站清除還原點集合

若要手動清除因資源群組鎖定而未清除的還原點集合,請嘗試下列步驟:

  1. 登入 Azure 入口網站

  2. [中樞] 功能表中選取 [所有資源],然後選取 VM 所在且格式為 AzureBackupRG_<Geo>_<number> 的資源群組。

    顯示如何選取資源群組的螢幕擷取畫面。

  3. 選取 [資源群組],[概觀] 窗格會隨即出現。

  4. 選取 [顯示隱藏的類型] 選項,以顯示所有隱藏的資源。 選取格式為 AzureBackupRG_<VMName>_<number> 的還原點集合。

    顯示如何選取還原點集合的螢幕擷取畫面。

  5. 選取 [刪除] 以清除還原點集合。

  6. 再次重試備份作業。

附註

如果該資源 (RP 集合) 含有大量還原點,則從入口網站刪除時可能會逾時並失敗。 這是已知的 CRP 問題,即所有還原點無法在規定時間內刪除,導致作業逾時。不過,刪除作業通常會在重試兩次或三次之後成功。