適用於 MySQL 的 Azure 資料庫中的高可用性

使用 Azure Database for MySQL Flexible Server，你可以設定高可用性並具備自動故障轉移功能。此解決方案可確保失敗永遠不會導致認可的資料遺失，而且資料庫不會是軟體結構中的單一失敗點。當你設定高可用性時，Flexible Server 會自動配置並管理備用的 Hyper-V 複本。您需要支付主要與次要複本的已佈建計算與儲存體費用。有兩個高可用性結構模型可供使用：

區域備援高可用性。此選項提供跨多個可用性區域的完整基礎結構隔離與備援。其提供最高層級的可用性，但您需要設定跨區域的應用程式備援。當你想防止可用性區域內的基礎設施故障，且整個可用性區域的延遲是可接受的時，選擇區域冗餘高可用性。你只能在建立伺服器時啟用區域冗餘高可用性。區域備援高可用性可在部分 Azure 區域中使用，這些區域支援多個可用性區域，並且提供區域備援 Premium 檔案共用。
本地冗餘高可用性。此選項提供具有較低網路延遲的基礎結構備援，因為主要與待命伺服器位於相同的可用性區域中。它提供高可用性，無需在區域間配置應用程式冗餘。當你希望在單一可用性區域內以最低網路延遲達到最高可用性時，選擇本地冗餘高可用性。本地冗餘高可用性適用於所有可使用「適用於 MySQL 的 Azure 資料庫彈性伺服器」的 Azure 區域。

區域備援高可用性 (HA) 結構

當你部署具備區域冗餘高可用性的伺服器時，Azure 會建立兩台伺服器：

主要伺服器建立在某個可用性區域中。
同一 Azure 區域的另一個可用區域中的備用複本伺服器。備用副本伺服器的設定與主伺服器相同，包括運算層級、運算大小、storage 大小及網路配置。

您可以同時為主要伺服器與待命複本選擇可用性區域。將主伺服器與待命伺服器放在同一區域可減少延遲，而將它們放在不同區域則有助於準備災難復原和區域降級情境。

資料與日誌檔案存放於區域冗餘儲存（ZRS）。待命伺服器會持續從主要伺服器的儲存體帳戶讀取並重新執行記錄檔，該帳戶受到儲存體層級複寫的保護。

容錯移轉發生時：

待命複本會啟用。
主要伺服器的二進位記錄檔會繼續套用至待命伺服器，使其上線至主要伺服器上的最後一筆已認可交易。

即使主要伺服器無法使用，仍然可以存取 ZRS 中的記錄。此可用性有助於確保不會遺失資料。啟用待命複本並套用二進位記錄之後，目前待命複本伺服器會扮演主要伺服器的角色。 DNS 會更新，讓客戶端連線在重新連線時直接連接到新的主節點。來自用戶端應用程式的容錯移轉完全透明，而且不需要您採取任何動作。 HA 解決方案接著會在可能時帶回舊的主要伺服器，並將其放置為待命伺服器。

您可以使用資料庫伺服器名稱將應用程式連線至主要伺服器。這個解決方案不會公開備援副本資訊讓大家直接地存取。在主要伺服器的 ZRS 上排清記錄檔之後，會確認認可和寫入。由於 ZRS storage 採用同步複製技術，應用程式寫入與提交延遲可預期增加 5-10%。

主要資料庫伺服器會自動備份快照和日誌備份，存放在區域冗餘的儲存體中。

本地冗餘高可用性 (HA) 架構

當你部署具有本地冗餘 HA 的伺服器時，你會在同一區域建立兩台伺服器：

主要伺服器
一台與主伺服器配置相同的備用複本伺服器（計算層級、運算大小、storage 大小及網路配置）

備用伺服器透過使用獨立的虛擬機（運算）來提供基礎設施冗餘。因為共置，所以此備援可減少應用程式與資料庫伺服器之間的容錯移轉時間和網路延遲。

資料與日誌檔案存放於本地冗餘storage（LRS）。待機伺服器持續讀取並重播主伺服器儲存體帳戶的日誌檔案，該日誌檔案受儲存層級的複寫保護。

容錯移轉發生時：

待命複本會啟用。
主要伺服器的二進位記錄檔會繼續套用至待命伺服器，使其上線至主要伺服器上的最後一筆已認可交易。

即使主要伺服器無法使用，仍然可以存取 LRS 中的記錄。此可用性有助於確保不會遺失資料。待命副本啟動並套用二進位日誌後，目前的備用副本會扮演主要伺服器的角色。 DNS 已更新，以在用戶端重新連線時，將連線重新導向至新的主要資料庫。來自用戶端應用程式的容錯移轉完全透明，而且不需要您採取任何動作。 HA 解決方案接著會在可能時帶回舊的主要伺服器，並將其放置為待命伺服器。

資料庫伺服器名稱會將應用程式連線至主要伺服器。備用複本資訊不會被直接存取。在主要伺服器的 LRS 上排清記錄檔之後，會確認認可和寫入。因為主要和待命複本位於相同的區域中，所以應用程式伺服器與資料庫伺服器之間的複寫延遲和延遲較低。當依賴的基礎設施在特定的可用區域中斷時，本地冗餘配置無法提供高可用性。除非該可用性區域的所有相依服務都重新上線，否則會停機。

主要資料庫伺服器會自動將快照和日誌備份到本地冗餘儲存空間。

附註

對於區域備援與本地備援 HA：

如果發生失敗，則待命複本接管主要複本角色所需的時間，取決於從主要複本儲存體帳戶重新執行二進位記錄到待命複本所需的時間。若要減少容錯移轉時間，請在所有資料表上使用主索引鍵。容錯移轉時間通常需要 60 到 120 秒。
待命伺服器不適用於讀取或寫入作業。這是啟用快速容錯移轉的被動待命。
請一律使用完整網域名稱 (FQDN) 以連線至主要伺服器。避免使用 IP 位址進行連線。如果發生容錯移轉，則在切換主要與待命伺服器角色之後，DNS A 記錄可能會變更。此變更會防止應用程式在 connection string 中使用 IP 位址時連接新的主要伺服器。

從現有伺服器遷移到區域冗餘伺服器

如果你原本是將 Azure Database for MySQL 伺服器配置為非 HA 伺服器，你可以啟用它以支援本地冗餘的 HA 架構。然而，如果你想啟用區域冗餘 HA 架構，你需要建立一台新伺服器，並依照以下步驟遷移到它：

請依照您偏好的部署工具指示，建立啟用區域冗餘高可用性的新伺服器：
- Azure 入口: 在 Azure Database for MySQL 中使用 Azure 入口管理區域冗餘高可用性
- Azure CLI：管理 Azure Database for MySQL 中的區域冗餘高可用性，使用 Azure CLI
請採用以下其中一種方法，將你的工作負載遷移到新伺服器。根據遷移方式，可能需要停機時間。
- 離線遷移方法： 如果你的應用程式能承受一些停機時間，離線遷移總是首選，因為它們簡單且容易執行。離線遷移時，來源伺服器會離線，並在目標伺服器上進行資料庫的傾印與還原。這個選項需要最多的停機時間。停機時間長短取決於在目標伺服器上執行恢復所需的時間。
  - 資料遷移服務（DMS）： 欲了解如何使用 DMS，請參見透過 Azure 入口網站使用 DMS 從 MySQL 遷移到 Azure Database for MySQL 離線。
    
    雖然教學說明了從本地 MySQL 伺服器遷移到 Azure Database for MySQL 的步驟，但你也可以用同樣的程序，將資料從一個不支援可用性區域的 Azure Database for MySQL 伺服器遷移到另一個支援可用性區域的伺服器。
  - 開源工具： 你可以透過使用 MySQL Workbench、 mydumper/myloader 或 mysqldump 等開源工具來備份和還原資料庫，進行離線遷移。欲了解如何使用這些工具，請參閱遷移選項 Azure Database for MySQL - 單伺服器轉為彈性伺服器。雖然教學說明了從 Azure MySQL 單一伺服器遷移到 Flexible Server 的步驟，但你也可以用同樣的程序，將資料從一個不支援可用性區域的 Azure Database for MySQL Flexible Server 遷移到另一個支援可用性區域的伺服器。
- 線上遷移方法： 線上遷移能減少應用程式停機時間。來源伺服器允許進行更新操作，遷移解決方案會在源伺服器和目標伺服器之間同步持續的變更，同時在目標伺服器上執行初步的數據導出和還原。然而，這些方法比離線遷移更複雜。
  - 資料遷移服務（DMS）： 欲了解如何使用 DMS，請參見透過 Azure 入口網站使用 DMS 從 MySQL 遷移至 Azure Database for MySQL 線上。
    
    雖然教學說明了從本地 MySQL 伺服器遷移到 Azure Database for MySQL 的步驟，但你也可以用同樣的程序，將資料從一個不支援可用性區域的 Azure Database for MySQL 伺服器遷移到另一個支援可用性區域的伺服器。
  - 開源工具：你可以將開源工具，例如 mydumper/myloader，與 Data-in 复制結合使用。

容錯移轉程序

在 Azure Database for MySQL 的故障轉移過程中，系統會自動從主要伺服器切換到備用副本。此切換可確保持續性並將停機時間降到最低。當系統偵測到失敗時，它會將待命複本升級為新的主要伺服器。系統會將原始主要伺服器的二進位記錄檔套用至待命複本。此流程會將待命複本與最後一筆已認可交易同步，並確保不會遺失資料。這種無縫的轉換有助於維持資料庫服務的高可用性與可靠性。

附註

為減少故障轉移時對 DNS 快取的依賴，自 2025 年 10 月開始，所有新建的具有公共存取或私有連接的高可用性伺服器將採用新架構，為每台高可用性伺服器提供專用的伺服器負載平衡器（SLB）。透過管理 MySQL 資料流量路徑，SLB 消除了容錯移轉期間 DNS 變更的需求，並顯著提高了容錯移轉效能。它在故障轉移期間，透過負載平衡規則將流量重新導向至目前的主要实例。現有擁有 public access 或 private link 的伺服器正逐步遷移，以減少影響。偏好早期遷移的客戶可以停用並重新啟用高可用性功能。此功能不支援使用 VNet 整合的 Private access 伺服器。

計劃性：強制容錯移轉

Azure Database for MySQL Flexible Server 的強制故障轉移功能允許你手動執行故障轉移。此功能可讓您使用應用程式案例來測試功能，並協助您為中斷做好準備。

強制故障轉移會觸發一次故障轉移，使備用副本使用相同的資料庫伺服器名稱並更新 DNS 記錄，成為主要伺服器。原始主要伺服器會重新啟動，並切換到待命複本。用戶端連線會中斷連線，而且需要重新連線才能恢復其作業。

整體的容錯移轉時間取決於目前的工作負載和最後一個檢查點。一般而言，需要 60 到 120 秒。

附註

Azure 資源健康狀態事件會在計劃的容錯移轉期間產生。該事件代表伺服器無法使用的容錯移轉時間。在左側窗格選取Resource Health時，你可以看到觸發的事件。該狀態會將使用者起始或手動容錯移轉表示為無法使用，並加上已規劃標記。例如，授權使用者已觸發容錯移轉作業 (已規劃)。如果您的資源長期處於此狀態，請開啟支援單，我們將協助您。

非計劃性：自動容錯移轉

非預期的服務停機可能因軟體錯誤或基礎設施故障（如運算、網路或storage故障）而發生。停電也會影響資料庫的可用性。如果資料庫變得無法使用，則複寫到待命複本的作業會停止，而且待命複本會成為主要資料庫。 DNS 會更新，而且用戶端會重新連線至資料庫伺服器，以繼續其作業。

整體容錯移轉時間通常在 60 到 120 秒之間。不過，視容錯移轉時主要資料庫伺服器中的活動而定 (例如大型交易與復原時間)，容錯移轉可能需要較長的時間。

附註

未規劃的容錯移轉會產生 Azure 資源健康狀態事件。該事件代表伺服器無法使用時的容錯移轉時間。你可以在左側窗格選擇Resource Health時看到觸發事件。自動故障轉移顯示狀態為 不可用 ，並標示為 非計畫性。

例如， 不可用：故障轉移操作自動觸發（未計畫）。如果你的資源長期處於此狀態，請開啟 support ticket，我們會協助你。

啟用 HA 的伺服器中的自動容錯移轉偵測運作方式

主要伺服器與次要伺服器各有兩個網路端點：

客戶端點：客戶會使用此端點連線並在執行個體上執行查詢。
管理端點：用於內部與管理元件的服務通訊及連接後端儲存。

狀況監控元件會持續執行下列檢查：

監控器會對節點的管理網路端點進行檢測。若此檢查連續失敗兩次，則會觸發自動容錯移轉作業。此健康檢查處理節點無法使用或因作業系統問題而無法回應、管理元件與節點間網路問題等情境。
監視器會在執行個體上執行簡單查詢。如果查詢無法執行，則會觸發自動容錯移轉。此健全狀態檢查可處理 MySQL 精靈當機、停止或掛起，以及後端儲存體問題與類似問題等情境。

附註

健康檢查不會監控應用程式與客戶網路端點（Private/Public access）之間的網路問題。這些問題可能發生在網路路徑、端點，或用戶端的 DNS 問題中。如果你使用私人存取，請確保虛擬網路的 NSG 規則不會阻擋與埠口 3306 的實例客戶網路端點的通訊。對於公開訪問，請確保已設定防火牆規則，且允許 3306 埠的網路流量（如果網路路徑中有其他防火牆的話）。您還需要從用戶端應用程式端處理 DNS 解析。

監視高可用性

若要檢查伺服器的高可用性設定狀態，請在入口網站中使用伺服器 [高可用性] 窗格中的 [高可用性狀態]。

狀態	說明
NotEnabled	未啟用高可用性。
ReplicatingData	待命伺服器會在高可用性伺服器配置期間或啟用高可用性選項時與主伺服器同步。
FailingOver	資料庫伺服器正在從主要伺服器容錯移轉至待命伺服器。
健康	高可用性選項已啟用。
取消待機	當你關閉高可用性選項時，刪除程序就已經開始了。

要監控高可用性伺服器的健康狀況，請使用以下指標。

計量顯示名稱	計量	單位	說明
HA `IO` 狀態	ha_io_running	狀態	HA `IO` 狀態會顯示 HA 複寫的狀態。如果 I/O 執行緒正在執行，則計量值為 1，否則為 0。
HA SQL 狀態	ha_sql_running	狀態	HA SQL 狀態會顯示 HA 複寫的狀態。如果 SQL 執行緒正在執行，則計量值為 1，否則為 0。
HA 複寫延遲	複製延遲	秒	複寫延遲是待命在重新執行從主要伺服器收到的交易時所落後的秒數。

限制

使用高可用性時請考慮以下事項：

你只能在伺服器建立時設定區域冗餘高可用性。
可高載計算層不支援高可用性。
重新啟動主要資料庫伺服器以套用靜態參數變更也會重新啟動待命複本。
該解決方案會開啟 GTID 模式，因為它使用 GTID。檢查您的工作負載是否有 GTID 的複寫限制。

附註

儲存自動擴充功能在高可用性配置的伺服器上預設啟用，無法關閉。

已知問題

Azure Database for MySQL 彈性伺服器在後端使用原生的 MySQL 複製。 MySQL Community Edition 8.0 及更新版本中存在已知問題。在執行依賴 ON DELETE CASCADE 外部索引鍵限制的多資料表 DELETE 作業時，可能會中斷複寫。這個問題被追蹤為 MySQL 錯誤102586。因此，當你在 Azure Database for MySQL Flexible Server 啟用高可用性時，請避免使用帶有外鍵的串接刪除，因為這種模式可能導致複製失敗，甚至影響伺服器的可用性。

健康情況檢查

當您為 Azure Database for MySQL 配置高可用性（HA）時，健康檢查在維持資料庫的可靠性與效能上扮演關鍵角色。這些檢查持續監控主要與備用複本的狀態與健康狀況，確保能及時偵測任何問題。透過追蹤伺服器響應性、複製延遲及資源利用率等多項指標，Health Check 協助確保故障轉移流程能無縫執行，減少停機時間並防止資料遺失。正確設定的健全狀態檢查，對於在資料庫設定中達到所需的可用性與復原能力水準至關重要。

監視健康情況

你可以透過 Azure 入口網站監控 HA 設定的健康狀況。要觀察的主要計量包括：

伺服器回應能力：指出主要伺服器是否可連線。
複寫延遲：測量主要複本與待命複本之間的延遲，確保資料一致性。
資源利用率：監控 CPU、記憶體及storage使用情況，以防止瓶頸。

可靠性與韌性

欲全面了解 MySQL Azure Database 的可靠性，包括暫時故障處理、可用性區域韌性、跨區域災難復原（含讀取副本）、備份與還原，以及服務維護，請參閱 MySQL 的 Azure Database 可靠性。

意見反應

此頁面對您有幫助嗎？

Last updated on 2026-04-23