共用方式為


Azure NetApp 檔案中的可靠性

本文說明 Azure NetApp 檔案中的可靠性支援,涵蓋透過可用性區域多區域部署的區域內復原能力。

當您使用 Azure 時, 可靠性是共同的責任。 Microsoft 提供一系列功能來支援韌性和復原。 您有責任瞭解這些功能在您使用的所有服務中如何運作,並選取符合業務目標和正常運作時間目標所需的功能。

Azure NetApp 檔案是原生企業等級檔案儲存體解決方案,可順暢整合至 Azure 中,並透過網路檔案系統 (NFS) 和伺服器訊息區 (SMB) 通訊協定在用戶端之間啟用檔案共用。 Azure NetApp 檔案專為高效能而設計,並提供可調整且安全的檔案儲存體,以服務形式管理。

若要使用 Azure NetApp 檔案,您必須設定 NetApp 帳戶,其中包含裝載磁碟區容量集區。 您可以獨立設定容量和輸送量,並管理符合各種需求的資料保護選項。 您可以啟用磁碟區之間的複寫,即使它們位於不同位置也一樣。

生產部署建議

若要了解如何部署 Azure NetApp 檔案以支援解決方案的可靠性需求,以及可靠性如何影響結構的其他層面,請參閱 Azure Well-Architected Framework 中 Azure NetApp 檔案的結構最佳做法

暫時性錯誤

暫時性錯誤是元件中的短暫間歇性失敗。 它們經常出現在雲端等分散式環境中,而且是作業的一般部分。 暫時性錯誤會在短時間內自行修正。 請務必讓您的應用程式能處理暫時性錯誤,這通常是透過重試受影響的要求來進行。

所有雲端裝載的應用程式在與任何雲端裝載的 API、資料庫和其他元件通訊時,都應該遵循 Azure 暫時性錯誤處理指引。 如需詳細資訊,請參閱 處理暫時性錯誤的建議

除了可能影響任何雲端式解決方案的暫時性錯誤類型之外,偶爾的計劃性維護 (例如平台更新、服務更新和軟體升級) 也會影響 Azure NetApp 檔案。

從檔案通訊協定 (例如 NFS 和 SMB) 的角度來看,如果應用程式可以處理這些事件期間可能發生的輸入/輸出 (I/O) 暫停,則暫時性錯誤不會造成干擾。 I/O 暫停通常很短,從幾秒鐘到 30 秒。 某些應用程式可能需要微調來處理 I/O 暫停。

NFS 通訊協定很強固,用戶端-伺服器檔案作業通常會正常繼續。 某些應用程式可能需要微調,才能處理長達 30 到 45 秒的 I/O 暫停。 請確定您了解應用程式的復原設定,以應付儲存體服務維護事件。

對於使用 SMB 通訊協定的人類互動式應用程式,標準通訊協定設定通常就已足夠。 Azure NetApp 檔案也支援 SMB 持續可用性,可啟用 SMB 透明容錯移轉。 SMB 透明容錯移轉可消除服務維護事件造成的中斷。 它也會改善可靠性和使用者體驗。

SMB 持續可用性僅適用於特定應用程式

如需更多建議,請參閱 Azure NetApp 檔案的應用程式復原常見問題集

可用性區域支援

可用性區域 是 Azure 區域內物理上獨立的資料中心群組。 當某個區域發生故障時,服務可以切換至其他剩餘的區域。

Azure NetApp 檔案支援磁碟區的區域性部署。 使用 Azure NetApp 檔案中的可用性區域磁碟區放置,將每個磁碟區部署在您選擇的單一可用性區域中。 只有在該可用性區域中存在 Azure NetApp 檔案且容量足夠時,您才能使用此功能。 如果您有延遲敏感的應用程式,您可以將磁碟區部署至與 Azure 計算資源和其他服務相同的可用性區域。

在下圖中,帶有實心箭頭的橘色箭頭代表對等互連虛擬網路中區域內的所有虛擬機器 (VM) 如何存取所有 Azure NetApp Files 資源。 綠色箭號代表在相同區域中存取 Azure NetApp 檔案磁碟區的 VM 如何共用可用性區域失敗網域。 平台層級的不同磁碟區之間沒有複寫。

顯示 Azure NetApp Files 可用性區域磁碟區放置位置的圖表。

顯示 Azure 區域中三個可用性區域的圖表。 帶有實心箭頭的橙色箭頭會連接代表跨可用性區域的 VM 和 Azure NetApp Files 資源的圖示。 綠色箭號會連接相同可用性區域中的 VM 和 Azure NetApp 檔案磁碟區。

單一區域部署不足以滿足高可靠性需求。 若要以非同步方式在不同可用性區域中的磁碟區之間複寫資料,您可以使用跨可用性區域複寫。 您必須分別設定跨可用性區域複寫與可用性區域磁碟區放置。

如果可用性區域失敗,您必須負責偵測失敗,並切換至不同區域中的替代磁碟區。

區域支援

跨可用性區域複寫適用於所有支援 Azure NetApp 檔案已啟用可用性區域的區域

考慮事項

  • Azure NetApp 檔案中的可用性區域磁碟區放置提供區域性磁碟區放置。 當您連線到相同可用性區域內的 VM 時,您會看到低延遲。 不過,可用性區域磁碟區放置不會提供 VM 或其他資源的鄰近放置,而且磁碟區可能位於資料中心的不同實體部分。

  • 只有在不同 Azure 訂用帳戶位於相同 Microsoft Entra 租用戶內時,才允許在不同 Azure 訂用帳戶之間複寫。

  • 如需 Azure NetApp 檔案中可用性區域的更多考量,請參閱使用跨可用性區域複寫的需求和考量管理可用性區域磁碟區放置

費用

在 Azure NetApp 檔案中啟用可用性區域磁碟區放置時,不需額外費用。 您只需為在這些區域內部署的容量集區和資源付費。

已複寫的磁碟區會裝載在容量集區上。 跨可用性區域複寫的成本是根據已佈建的容量集區大小和分層。 資料複寫沒有額外成本。

設定可用性區域支援

您必須個別設定磁碟區放置和跨可用性區域複寫。

正常作業

本節說明將多個 Azure NetApp 檔案磁碟區部署至個別可用性區域、啟用跨可用性區域複寫,以及所有可用性區域都可運作時,預期會發生什麼情形。

  • 區域之間的流量路由:傳入要求會路由傳送至位於您選取的可用性區域中的特定磁碟區。

  • 區域之間的資料複寫:Azure NetApp 檔案跨可用性區域複寫表示對來源磁碟區的所有變更都會以非同步方式複寫到目的地磁碟區。 您可以決定複寫發生的頻率。 跨可用性區域複寫支援三個複寫排程:每 10 分鐘、每小時和每日。

    這很重要

    使用跨可用性區域複寫的大型磁碟區不支援 10 分鐘的複寫排程。

區域關閉體驗

本節說明將多個 Azure NetApp 檔案磁碟區部署至個別可用性區域、啟用跨可用性區域複寫,並且有可用性區域中斷時,預期會發生什麼情形。

  • 偵測和回應:您必須負責偵測可用性區域遺失並起始容錯移轉。

    若要監視 Azure NetApp 檔案磁碟區的健康情況,您可以使用 Azure 監視器計量。 Azure 監視器會透過即時計量 (例如每秒輸入/輸出作業數 (IOPS)、延遲和容量使用量) 來偵測任何異常,以指出區域關閉案例。 您可以設定要傳送給系統管理員的警示和通知,讓他們可以透過重新平衡檔案共用或起始容錯移轉或其他災害復原通訊協定來立即回應。

    容錯移轉是手動程序。 當您需要啟用目的地磁碟區時,例如當您想要容錯移轉至目的地可用性區域時,您需要中斷複寫對等互連,然後掛接目的地磁碟區。 如需詳細資訊,請參閱容錯移轉至目的地磁碟區

  • 作用中要求:在區域關閉事件期間,作用中要求可能會遇到中斷或增加的延遲。

  • 預期資料遺失:在區域容錯移轉期間,您可以預期的資料遺失量或復原點目標 (RPO) 取決於您設定的跨可用性區域複寫排程。

    複寫排程 一般 RPO
    每 10 分鐘 20 分鐘
    每小時 兩小時
    每日 少於 48 小時
  • 預期停機時間:容錯移轉至另一個區域時,您必須中斷對等互連關聯性,才能啟用目的地磁碟區,並在第二個站台中提供讀取和寫入資料存取權。 觸發對等互連中斷之後,您可以預期容錯移轉會在一分鐘內完成。

    不過,在區域容錯移轉期間,您可以預期的停機時間總量或復原時間目標 (RTO) 取決於多個因素,包括系統或程序偵測區域遺失並起始容錯移轉程序所需的時間。 決定是否自動化回應或是否需要手動步驟也很重要。 對於準備充分的設定,整個程序通常需要幾分鐘到一個小時即可完成。

  • 流量重新路由:您必須負責將應用程式流量重新導向,以連線到新作用中目的地磁碟區。 如需詳細資訊,請參閱容錯移轉至目的地磁碟區

區域復原

容錯回復是一個手動程序,需要您執行重新同步作業、重新建立複寫,以及重新掛接來源磁碟區以供用戶端存取。 如需詳細資訊,請參閱使用 Azure NetApp 檔案管理災害復原

測試區域失敗

您可以使用磁碟區的快照集,安全地測試跨可用性區域複寫設定。 若要了解測試跨可用性區域複寫設定的高階方法,請參閱測試 Azure NetApp 檔案的災害復原

多區域支援

根據預設,Azure NetApp 檔案是單一區域服務。 如果區域變成無法使用,則儲存在該區域中的磁碟區也無法使用。 為了在發生區域中斷時改善復原能力,Azure NetApp 檔案支援跨區域複寫。 您可透過非同步方式,將資料從某個區域中的 Azure NetApp 檔案磁碟區 (來源) 複寫到 Microsoft 預先選取之另一個區域中的另一個 Azure NetApp 檔案磁碟區 (目的地)。 如果發生全區域中斷或災害,這項功能可讓您容錯移轉關鍵應用程式。

備註

您也可以將單一磁碟區複寫至另一個可用性區域另一個區域。 如需詳細資訊,請參閱了解 Azure NetApp 檔案複寫

區域支援

您可以複寫磁碟區的次要區域取決於主要區域。 如需詳細資訊,請參閱支援的區域配對

考慮事項

只有在不同 Azure 訂用帳戶位於相同 Microsoft Entra 租用戶內時,才允許在不同 Azure 訂用帳戶之間複寫。

如需與 Azure NetApp 檔案中跨區域複寫相關的其他考量,請參閱使用跨區域複寫的需求和考量

費用

跨區域複寫費用是根據您複寫的資料量而定。 如需詳細資訊和一些範例案例,請參閱跨區域複寫的成本模型

設定多區域支援

正常作業

本節說明當 Azure NetApp 檔案磁碟區設定為使用跨區域複寫,且這兩個區域都可運作時,預期會發生什麼情形。

  • 區域之間的流量路由:傳入要求會路由傳送至位於主要區域中的特定磁碟區。

  • 區域之間的資料複寫:Azure NetApp 檔案跨區域複寫表示對來源磁碟區的所有變更都會以非同步方式複寫到目的地磁碟區。 您可以決定複寫發生的頻率。 跨區域複寫支援三個複寫排程:每 10 分鐘、每小時和每日。

    這很重要

    使用跨區域複寫的大型磁碟區不支援 10 分鐘的複寫排程。

  • 監視複寫健康情況:您可以監視對等互連關聯性的健康情況,而且您可以設定警示,在複寫延遲增加超過預期的閾值時通知您。 若要深入了解,請參閱顯示複寫關聯性的健康情況和監視狀態

區域關閉體驗

本節說明當 Azure NetApp 檔案磁碟區設定為使用跨區域複寫,而主要區域發生中斷時,預期會發生什麼情形。

  • 偵測和回應:您必須負責偵測區域遺失並起始容錯移轉。

    若要監視 Azure NetApp 檔案磁碟區的健康情況,您可以使用 Azure 監視器計量。 Azure 監視器會透過即時計量 (例如IOPS、延遲和容量使用量) 來偵測任何異常,以指出區域關閉案例。 您可以設定要傳送給系統管理員的警示和通知,讓他們可以透過重新平衡檔案共用或起始容錯移轉或其他災害復原通訊協定來立即回應。

    容錯移轉是手動程序。 當您需要啟用目的地磁碟區時,例如當您想要容錯移轉至目的地區域時,您需要中斷複寫對等互連,然後掛接目的地磁碟區。 如需詳細資訊,請參閱容錯移轉至目的地磁碟區

  • 作用中要求:在區域關閉事件期間,作用中要求可能會遇到中斷或增加的延遲。

  • 預期資料遺失:在區域容錯移轉期間,您可以預期的資料遺失量或 RPO 取決於您設定的跨區域複寫排程。

    複寫排程 一般 RPO
    每 10 分鐘 少於 20 分鐘
    每小時 少於兩小時
    每日 少於 48 小時
  • 預期停機時間:容錯移轉至另一個區域時,您必須中斷對等互連關聯性,才能啟用目的地磁碟區,並在第二個站台中提供讀取和寫入資料存取權。 觸發對等互連中斷之後,您可以預期容錯移轉會在一分鐘內完成。

    不過,在區域容錯移轉期間,您可以預期的停機時間總量或 RTO 取決於多個因素,包括系統或程序偵測區域遺失並起始容錯移轉程序所需的時間。 決定是否自動化回應或是否需要手動步驟也很重要。 對於準備充分的設定,整個程序通常需要幾分鐘到一個小時即可完成。

  • 流量重新路由:您必須負責將應用程式流量重新導向,以連線到新作用中目的地磁碟區。 如需詳細資訊,請參閱容錯移轉至目的地磁碟區

區域復原

主要區域復原之後,您負責進行容錯回復。 容錯回復是一個手動程序,需要您執行重新同步作業、重新建立複寫,以及重新掛接來源磁碟區以供用戶端存取。 如需詳細資訊,請參閱使用 Azure NetApp 檔案管理災害復原

測試區域失敗

您可以使用磁碟區的快照集,安全地測試跨區域複寫設定。 若要了解測試跨區域複寫設定的高階方法,請參閱測試 Azure NetApp 檔案的災害復原

備份

Azure NetApp 檔案備份藉由提供完全受控備份解決方案,來擴充 Azure NetApp 檔案的資料保護功能,以進行長期復原、封存和法規遵循作業。 服務所建立的備份會儲存在 Azure 儲存體中,與可供短期復原或複製的磁碟區快照無關。 服務所建立的備份可以還原到區域內的新 Azure NetApp 檔案磁碟區。 Azure NetApp Files 備份支援原則式 (排程) 備份,以及手動 (隨選) 備份。

為了獲得進一步的安全性,Azure NetApp 檔案快照集會新增穩定性、可擴縮性和快速復原性,而不會影響效能。 它們為其他備援解決方案提供基礎,包括備份、跨區域複寫和跨區域複寫。

針對大部分的解決方案,您不應該只依賴備份。 請改用本指南中所述的其他功能來支持復原需求。 不過,備份可防範其他方法未發生的一些風險。 欲了解更多資訊,請參閱冗餘、複寫與備份是什麼?

服務等級協定

Azure 服務的服務等級協定 (SLA) 描述服務的預期可用性,以及解決方案必須符合才能達到該可用性預期的條件。 如需詳細資訊,請參閱 在線服務的 SLA