Azure Site Recovery 概觀
- 10 分鐘
Azure Site Recovery 不僅僅是協助您從系統中斷中復原的工具。 Azure Site Recovery 會將工作負載在主要和次要站台之間進行複寫。 Site Recovery 也可以用來將 VM 從內部部署基礎結構移轉至 Azure。
例如,保護工作負載免受地震影響的第一項工作,就是檢閱公司目前的商務持續性和災害復原(BCDR)計劃。 您必須識別需要保護之系統的不同復原目標和範圍。
在此單元中,您會調查 Azure Site Recovery 如何協助達成這些目標,並在發生災害時讓資源的故障轉移和復原成為可能。
商務持續性和災害復原
遺失服務可能會對您的員工和使用者造成中斷。 系統無法使用的每一秒,都可能導致公司的收入損失。 貴公司也可能因未能確保您提供服務的可用性而違反合約並面臨財務處罰。
BCDR 計劃是公司制定的正式文件,涵蓋災害或大規模中斷發生時應採取的範圍和動作。 每個中斷都會以其特點進行評估。 例如,當整個數據中心失去電源時,BCDR 計劃就會生效。
在此範例案例中,發生地震並損壞通信線路,使數據中心無用且需要修復。 此大小的災害可能會使服務中斷數天,而不是數小時,因此必須叫用完整的 BCDR 方案,才能讓服務重新上線。
在您的 BCDR 方案中,識別應用程式的復原時間目標(RTO)和恢復點目標。 這兩個目標一起有助於識別您的企業可以沒有指定服務的最大時數,以及數據復原程式應該是什麼。 讓我們更仔細研究每個項目。
復原時間目標
RTO 是企業在災害發生後生存的時間上限,直到必須還原正常服務,以避免因持續性中斷所造成的任何不可接受的後果。 假設 RTO 為 12 小時,這表示在核心服務不起作用的情況下,作業可以持續 12 小時。 如果停機時間延長,您的企業將受到嚴重損害。
恢復點目標
RPO 是災害發生后可接受的最大數據遺失量量值。 企業通常會決定每隔 24 小時、12 小時或甚至即時執行備份。 如果發生災害,則一律會有一些數據遺失。
例如,如果您的備份每 24 小時午夜發生一次,且災害發生在上午 9:00,則會遺失 9 小時的數據。 若您公司的 RPO 是 12 小時,影響便不會太嚴重,因為期間只經過了九小時。 若 RPO 是 4 小時,此情況將會是個問題,並會對業務造成傷害。
什麼是 Azure Site Recovery?
Azure Site Recovery 可以為您的BCDR方案做出貢獻,因為它可以將工作負載從主要月臺復寫到次要月臺。 如果主要站點發生問題,可以自動叫用 Site Recovery 將受保護的虛擬機器複製到另一個位置。 故障轉移可能是從內部部署到 Azure,也可以從一個 Azure 區域到另一個區域。
Azure Site Recovery 的一些顯著功能包括:
- 中央管理:全都可以從 Azure 入口網站內來設定及管理複寫,以及叫用容錯移轉和容錯回復。
- 內部部署虛擬機器複寫:如有必要,內部部署虛擬機器可以複寫至 Azure 或次要內部部署資料中心。
- Azure 虛擬機複製:Azure 的虛擬機可以從一個區域複製到另一個區域。
- 故障轉移期間的應用程式一致性:藉由使用恢復點和應用程式一致快照集,虛擬機一律會在復寫期間保持一致狀態。
- 彈性故障轉移:故障轉移可以視需要執行,作為測試或在實際災害期間觸發。 您可以執行測試來模擬災害復原案例,而不會中斷實時服務。
- 網路整合:Site Recovery 可以在復寫和災害復原案例期間管理網路管理。 包含保留的IP位址和負載平衡器,讓虛擬機可以在新的位置運作。
設定 Azure Site Recovery
必須設定數個元件,才能啟用 Azure Site Recovery:
- 網路:需要有效的 Azure 虛擬網路來供復寫的虛擬機器使用。
- 復原服務保存庫:Azure 訂用帳戶中的保存庫會在執行故障轉移時儲存已移轉的 VM。 該保存庫也會包含複寫原則,以及適用於複寫和容錯移轉的來源及目標位置。
- 認證:您用於 Azure 的認證必須具有 虛擬機參與者 和 Site Recovery 參與者 角色,才能允許修改虛擬機 (VM) 和 Site Recovery 所連線記憶體的許可權。
-
組態伺服器:內部部署 VMware 伺服器會在故障轉移和複寫過程期間執行多種功能。 您可以從 Azure 入口網站取得它,作為開放式虛擬機設備 (OVA),以方便部署。 組態伺服器包含:
- 進程伺服器:此伺服器可作為複寫流量的閘道。 它會先快取、壓縮和加密流量,再透過WAN 傳送至 Azure。 進程伺服器也會將行動服務安裝到所有以故障轉移和複寫為目標的實體和虛擬機上。
- 主要目標伺服器:此機器在從 Azure 回退過程中處理複寫過程。
這很重要
若您要從 Azure 容錯回復到內部部署環境,即使您只是要將實體機器複寫到 Azure,仍必須搭配具備設定伺服器的 VMware vCenter。 您無法容錯回復到實體伺服器。
複寫程序
設定必要條件工作後,機器設備的複製即可開始。 它們會根據現行的複製策略被複製。 在第一個複本的初始階段,伺服器數據會復寫至 Azure 記憶體。 初始復寫完成之後,會發生第二次複寫。 此時,對虛擬機器進行的變更差異會複寫到 Azure。
測試並監視容錯移轉
設定環境以進行災害復原之後,請測試它以確定組態正確無誤,且一切如預期般運作。 在隔離的 VM 上執行災害復原演練,以測試設定。 最佳做法是針對測試使用隔離網路,讓即時服務不會中斷。
嘗試復原演練的第一項工作是在 Azure 入口網站的 [ 受保護的專案 ] 區段中驗證測試虛擬機屬性。 從 [ 複寫的專案 ] 窗格檢視最新的恢復點。 在 [計算與網络 ] 區段中,視需要調整虛擬機名稱、資源群組、目標大小、可用性設定組和磁碟設定。
您可以從 Azure 入口網站的 [ 設定>複寫的專案 ] 區段啟動復原演練。 選取目標虛擬機器,然後選取最新已處理復原點的 [測試容錯移轉] 功能表項目。 在相同的功能表中選取 Azure 網路。 若要啟動復原作業,請在網路選取畫面上選取 [確定 ]。
復原作業和復寫虛擬機的狀態可透過復原服務保存庫的 [概 觀 ] 區段來存取。 複寫的項目狀態如下:
- 良好:複寫正在正常運作。
- 警告:有可能會影響複製的問題。
- 重大:偵測到重大復寫錯誤。
如果一切順利,復寫的 VM 狀態會設定為 [成功執行]。 如果未完成測試,狀態會設定為 [建議的測試]。 如果上次測試超過六個月前,VM 也會設定為 [建議測試 ]。