Azure 裝置登錄 儲存雲端資產與裝置的資訊。 裝置登錄檔將資產投影為雲端的 Azure 資源,並集中在同一個登錄檔內。 單一登錄是裝置和資產元數據以及資產管理功能的真實來源。 裝置登錄可與 Azure IoT 操作 搭配使用。
使用Azure時,可靠性是共同責任。 Microsoft 提供一系列功能來支援韌性和復原。 您有責任瞭解這些功能在您使用的所有服務中如何運作,並選取符合業務目標和正常運作時間目標所需的功能。
本文說明如何讓裝置登錄系統對各種潛在的中斷與問題具備韌性,包括暫時性故障、可用區域中斷及區域中斷。
備註
Azure IoT 操作 除了裝置登錄外,還包含多種其他元件。 關於Azure IoT 操作元件的高可用性與零資料遺失特性的詳細資訊,請參閱Azure IoT 操作常見問題。
對瞬態故障的彈性
暫時性錯誤是元件中的短暫間歇性失敗。 它們經常出現在雲端等分散式環境中,而且是作業的一般部分。 暫時性錯誤會在短時間內自行修正。 請務必確保您的應用程式能妥善處理暫時性錯誤,通常透過重試受影響的請求來進行。
所有雲端託管應用程式在與任何雲端託管的 API、資料庫及其他元件通訊時,都應遵循 Azure 暫態故障處理指引。 如需詳細資訊,請參閱 處理暫時性錯誤的建議。
用戶端透過 Azure Resource Manager 與裝置登錄檔互動。 通常你會使用 Azure 入口網站、Azure CLI 或 Azure SDK 來與裝置登錄資源互動,這些工具能自動處理暫時性故障。 如果你直接使用 Resource Manager API,務必處理暫時性錯誤。
對可用性區域故障的抵抗力
可用性區域是Azure區域內物理上獨立的資料中心群組。 當某個區域發生故障時,服務可以切換至其他剩餘的區域。
Azure裝置登錄檔預設是區域冗餘的,這表示它會自動在多個
Microsoft 在 Azure Device Registry 中管理區域冗餘的設定與設定。 您不需要再執行任何設定,即可啟用此區域備援。 Microsoft 可確保服務已設定為提供最高層級的可用性和可靠性。
需求
區域支援: 以下區域列表支援裝置登錄中可用性區域:
| 美洲 | 歐洲 |
|---|---|
| 美國東部 | 德國中西部 |
| 美國東部 2 | 北歐 |
| 美國西部 | 西歐 |
| 美國西部 2 | |
| 美國西部 3 |
費用
使用區域冗餘來處理裝置登錄不會額外收費。
設定可用性區域支援
當你在 Azure IoT 操作 建立裝置登錄資源時,預設是區域冗餘的。 您不需要再執行任何設定。
所有區域都狀況良好時的行為
下列資訊說明當您擁有一個區域備援裝置註冊表且所有可用性區域均正常運作時的情況:
區域之間的流量路由: 要求會自動分散到每個可用性區域。 要求可能會送至任何可用性區域中的 Device Registry 實例。
區域之間的數據復寫: 裝置數據會跨可用性區域同步複寫。
區域失敗期間的行為
下列資訊說明當您有一個具備區域備援的裝置登錄時,如果某個可用性區域發生中斷,會出現什麼情況。
- 偵測與回應: 因為裝置登錄會自動偵測並回應可用性區的故障,因此你不需要做任何事來啟動可用性區故障轉移。
- 通知: Microsoft 不會在區域關閉時自動通知您。 不過,你可以使用 Azure 服務健康狀態 來了解服務整體健康狀況,包括任何區域故障,並且可以設定 Service Health 警示來通知你問題。
作用中要求: 某些作用中要求可能會遭到捨棄,因此可能需要以與其他暫時性錯誤相同的方式重試。 為了確保您的應用程式對任何瞬態故障具備韌性,請參閱 「對暫態故障的韌性」。
預期的數據遺失: 區域失敗不會造成任何數據遺失。
預期的停機時間: 區域失敗不預期會導致資源停機。
區域復原
當可用區域恢復時,裝置登錄會自動恢復該區域的操作。
測試區域失敗
裝置登錄平台負責管理跨可用性區域的流量路由、故障轉移與備援。 您不需要開始任何事情。 由於此功能是完全管理的,您不需要驗證可用區的故障程序。
對區域範圍故障的復原能力
Device Registry 是單一區域服務。 如果區域變成無法使用,您的裝置登錄資源也無法使用。
不過,登錄的數據會複製到配對區域。 如果發生長時間的區域性中斷,Microsoft 可能會選擇將服務切換至配對的區域。 如果發生這種情況,您的註冊表將繼續在配對區域中可用。
需求
區域支援: 在所有裝置登錄系統可用的區域都支援預設複製與故障轉移,因為 這些區域都是配對的。
費用
跨區域數據復寫或故障轉移不需要額外費用。
設定複寫並準備容錯移轉
根據預設,當您使用配對在區域中建立裝置登錄資源時,會自動設定跨區域數據複寫。 此程式是預設選項,不需要您介入。
當所有區域都正常時的行為
本節說明當裝置登錄設定為跨區域複寫和故障轉移,並且主要區域正常運行時,可以預期會發生的情況。
區域之間的數據復寫: 數據會自動復寫到配對的區域。 複寫會以非同步方式發生,這表示如果發生故障轉移,預期會發生某些數據遺失。
區域之間的流量路由: 在正常作業中,流量只會流向主要區域。
區域失敗期間的行為
本節說明當裝置登錄檔設定為跨區域複寫和容錯移轉且主要區域中斷時,會發生什麼事。
偵測和回應:如果主要區域遺失,Microsoft 可以決定執行容錯移轉。 在主要區域遺失之後,此過程可能需要數小時,甚至在某些情況下更久。 裝置登錄資源的故障轉移可能不會與其他 Azure 服務同時發生。
Notification:區域故障事件可透過Azure 服務健康狀態監控。 設定警示以接收區域層級問題的通知。
作用中要求: 在故障轉移期間,主要區域正在處理的任何要求都可能會遺失。 客戶應該在容錯移轉完成之後重試要求。
預期的數據遺失: 數據會以異步方式複寫至配對的區域。 因此,在容錯移轉之後,可能會有一些資料遺失。 在區域故障切換後,您可能會遭遇少於 15 分鐘的資料遺失。
預期的停機時間: 預期的停機時間約為 24 小時,從區域失效到資源在配對區域中再次可用為止。
流量重新路由: 在故障轉移過程中,Device Registry 會更新 DNS 記錄,以指向配對的區域。 所有後續請求都會傳送至配對的區域。
登錄的故障轉移作業完成之後,裝置和後端應用程式的所有作業都有望繼續運作,而不需要手動介入。
區域復原
當主要區域恢復時,裝置登錄會自動恢復該區域的操作。
區域故障測試
裝置登錄平台負責管理成對區域間的流量路由、故障轉移與故障恢復。 您不需要開始任何事情。 由於此功能完全管理,因此您不需要驗證配對區域的故障流程。