探索 Azure 上的 SAP HANA (大型執行個體) 高可用性和災害復原

已完成

高可用性和災害復原 (DR) 對執行具任務關鍵性的 SAP HANA on Azure (大型執行個體) 伺服器來說,是極其重要的層面。 請務必與 SAP、您的系統整合者或 Microsoft 合作,以便正確建構及實作正確的高可用性和災害復原策略。 也務必考量您環境特有的復原點目標 (RPO) 和復原時間目標 (RTO)。

Microsoft 可透過 HANA 大型執行個體支援某些 SAP HANA 高可用性功能。 這些功能包括:

  • 儲存體複寫:儲存體系統將所有資料複寫到另一個 Azure 區域中另一個 HANA 大型執行個體戳記的能力。 SAP HANA 獨立運作,不依賴此方法。 此功能是提供給 HANA 大型執行個體使用的預設災害復原機制。
  • HANA 系統複寫:將 SAP HANA 中的所有資料複寫到個別的 SAP HANA 系統。 復原時間目標是透過定期的資料複寫而最小化。 SAP HANA 支援非同步、記憶體內同步及同步模式。 同步模式僅用於相同資料中心內或距離 100 公里內的 SAP HANA 系統。 以 HANA 大型執行個體戳記目前的設計而言,HANA 系統複寫只可用於單一區域內的高可用性。 HANA 系統複寫需要第三方反向 Proxy 或路由元件,以便在另一個 Azure 區域中進行災害復原設定。
  • 主機自動容錯移轉:SAP HANA 的本機錯誤復原解決方案,可作為 HANA 系統複寫的替代選項。 如果主要節點變得無法使用,能以擴增模式設定一或多個待命 SAP HANA 節點,而 SAP HANA 會自動容錯移轉到待命節點。

當您設定附有自動容錯移轉功能的 HANA 大型執行個體 HSR 時,您可以要求 Microsoft 服務管理小組為您現有的伺服器設定 STONITH 裝置。

這個架構支援不同 Azure 區域中 HANA 大型執行個體之間的災害復原。 有兩種方式可支援具有 HANA 大型執行個體的 DR:

  • 儲存體複寫。 主要儲存體內容會持續複寫到指定 DR HANA 大型執行個體伺服器上可用的遠端 DR 儲存體系統。 在儲存體複寫中,HANA 資料庫不會載入記憶體。 此 DR 選項從管理的觀點而言更簡單。 若要判斷這是否為合適的策略,請針對可用性 SLA 考量資料庫載入時間。 儲存體複寫也可讓您執行時間點復原。 如果已設定多用途 (成本最佳化) DR,您必須購買與 DR 位置相同大小的額外儲存體。 Microsoft 為 HANA 容錯移轉提供自助式儲存體快照集和容錯移轉指令碼,作為 HANA 大型執行個體供應項目的一部分。
  • DR 區域中具有第三個複本的多層 HSR (其中 HANA 資料庫會載入記憶體)。 此選項支援較快的復原時間,但是不支援時間點復原。 HSR 需要次要系統。 針對 DR 網站的 HANA 系統複寫是透過 Proxy (例如 nginx 或 IP 資料表) 進行處理。

Azure 上的 SAP HANA (大型執行個體) 在四個地緣政治區域 (美國、澳洲、歐洲和日本) 中的兩個 Azure 區域提供。 地緣政治區域內裝載 HANA 大型執行個體戳記的兩個區域,會與個別的專用網路線路連線。 這會用來複寫儲存體快照集,以提供災害復原方法。 複寫不會在預設中建立,但會為訂購災害復原功能的客戶設定。 執行儲存體複寫需要使用 HANA 大型執行個體的儲存體快照集。 您無法選擇 Azure 區域作為 DR 區域,因為該區域位於不同的地緣政治地區。

下表顯示目前支援的高可用性和災害復原方法以及兩者的組合:

HANA 大型執行個體所支援的案例

高可用性選項

災害復原選項

註解

單一節點

不適用。

專用 DR 設定。 多用途 DR 設定。

-

主機自動容錯移轉:擴增 (不一定有待命),包含 1+1

可透過擔任作用中角色的待命節點來實現。 HANA 會控制角色的切換。

專用 DR 設定。 多用途 DR 設定。 使用儲存體複寫進行的 DR 同步處理。

HANA 磁碟區組會連接到所有節點。 DR 網站必須具有相同數目的節點。

HANA 系統複寫

可透過主要或次要設定來實現。 在容錯移轉的情況下,次要節點會轉而成為主要節點。 HANA 系統複寫和 OS 控制容錯移轉。

專用 DR 設定。 多用途 DR 設定。 使用儲存體複寫進行的 DR 同步處理。 若沒有第三方元件,則還無法實現使用 HANA 系統複寫來進行的 DR。

另一組不同的磁碟區會連結至每個節點。 只有生產網站中次要複本的磁碟區會複寫到 DR 位置。 DR 網站需要一組磁碟區。

作為專用 DR 設定時,DR 網站中的 HANA 大型執行個體單位不會用於執行任何其他工作負載或非生產系統。 該單位是被動的,只會在災害容錯移轉執行時部署。 然而,此設定不是許多客戶偏好的選擇。

SAP HANA MCOD 部署 (一個單位上有多個 HANA 執行個體) 如表格中所列出 HA 與 DR 方法搭配使用的重疊情況所示。 根據 Pacemaker 將 HANA 系統複寫與自動容錯移轉叢集搭配使用的情況例外。 這種情況僅支援每個單位一個 HANA 執行個體。 針對 SAP HANA MDC 部署,若已部署多個租用戶,則只有以非儲存體為基礎的 HA 與 DR 方法才能正常運作。 如果已部署一個租用戶,則所有列出的方法皆有效。

作為多用途 DR 設定時,DR 網站上的 HANA 大型執行個體單位會執行非生產工作負載。 在災害情況下,關閉非生產系統,掛接儲存體複寫的 (其他) 磁碟區組,然後啟動生產 HANA 執行個體。 許多使用 HANA 大型執行個體災害復原功能的客戶都使用此設定。

您可以在下列 SAP 文章中找到更多關於 SAP HANA 高可用性的資訊: