Azure 儲存體動作中的可靠性
本文說明 Azure 儲存體動作的可靠性支援,並涵蓋可用性區域的區域內復原能力,以及跨地區災害復原和商務持續性。 如需更多關於 Azure 可靠性準則的詳細概觀,請參閱 Azure 可靠性。
[Azure 儲存體動作] 是可用於跨多個儲存體帳戶對數百萬個物件執行一般資料作業的無伺服器架構。 服務本身為地區性,且沒有可用性區域的 SKU 或支援。 不過,服務的控制平面會自動支援區域備援。 資料平面也可能支援備援,視儲存體帳戶是否在區域備援設定上執行而定。
可用性區域支援
Azure 可用性區域是每個 Azure 區域內至少三個實體獨立的資料中心群組。 每個區域內的資料中心都配備了獨立的電源、冷卻系統和網路基礎結構。 在本機區域失敗的案例中,可用性區域的設計在於,當一個區域受影響時,讓其餘兩個區域支援區域服務、容量和高可用性。
這類失敗的範圍可從軟體和硬體故障,擴及到如地震、淹水和火災的事件。 透過 Azure 服務的備援和邏輯隔離,實現對失敗的容錯。 如需深入了解 Azure 的可用性區域,請參閱區域和可用性區域。
已啟用 Azure 可用性區域的服務旨在提供正確程度的可靠性和彈性。 您可以透過兩種方式加以設定。 它們可以是區域備援,具有跨區域自動複寫功能,或者是區域性的,將執行個體釘選在特定區域。 兩種方法可以結合使用。 如需深入了解區域和區域備援結構,請參閱使用可用性區域和區域的建議。
雖然 Azure 儲存體動作服務是地區性服務,且不提供 SKU 或可用性區域,但區域性備援可從控制平面取得,並有條件地從資料平面取得:
服務的控制平面是區域備援。 當某個地區中的區域關閉時,控制平面會繼續可供使用。 在區域關閉案例中,您可以繼續管理工作定義和指派。
資料平面 (工作分派執行) 會從父儲存體帳戶繼承區域屬性。 如果儲存體帳戶部署至失敗的區域,則帳戶會變成無法使用,且從客戶的觀點來看,資料方案無法使用。 如果儲存體帳戶是區域備援,則帳戶會繼續可供使用,而服務會繼續在帳戶上執行作業。
分區關閉體驗
在區域完成的案例中,儲存體動作服務會繼續可供使用。 工作的進度取決於其執行所在的儲存體帳戶可用性區域支援。 如果帳戶不受關閉區域影響,工作就會繼續進行。 否則,工作會失敗。
分區中斷準備和復原
儲存體動作服務不是區域性服務,但儲存體帳戶是。 如果儲存體帳戶受到區域中斷的影響,則指派給帳戶的儲存體工作會失敗。 區域和儲存體帳戶可供使用之後,排程的工作會根據排程繼續執行。 如果工作設定為執行一次,您可能需要排程工作再次執行。
跨區域災害復原和商務持續性
災害復原 (DR)是指從重大影響事件中復原,例如自然災害或不成功的部署 (導致停機和資料遺失)。 無論原因為何,解決災害的最佳辦法是定義完善且經過測試的 DR 方案,以及主動支援 DR 的應用程式設計。 開始思考建立災害復原方案之前,請參閱設計災害復原策略的建議。
Microsoft 在災害復原方面採取共同責任模型。 在共同責任模型中,Microsoft 確保基準基礎結構和平台服務可供使用。 此時,許多 Azure 服務不會自動複寫資料,或從失敗區域回復為交叉複寫到另一個已啟用的區域。 您需要為這些服務制定適合工作負載的災害復原方案。 大多數在 Azure 平台即服務 (PaaS) 供應項目執行的服務,皆提供支援災害復原的功能和指導,您可以使用支援快速復原的特定服務功能來開發災害復原方案。
儲存體動作是地區性服務,其會針對相同地區中的帳戶執行。 當地區關閉時,儲存體帳戶和服務也會關閉。 服務不支援跨地區進行災害復原。 如果您觸發儲存體帳戶容錯移轉至不同的地區,則除非儲存體帳戶容錯回復到原始地區,否則無法對儲存體帳戶執行儲存體工作。 因此,雖然您可以復原儲存體帳戶,但將無法對其執行儲存體工作。
重要
如果您將儲存體帳戶從 GRS 或 GZRS 主要地區移轉至次要地區,或反之進行,則不會觸發以儲存體帳戶為目標的任何儲存體工作,且任何現有的工作執行可能都會失敗。
中斷偵測、通知及管理
當服務本身發生中斷時,儲存體工作不會傳送任何通知。 請務必檢查儲存體工作的狀態,並在服務/地區復原之後重試工作。