本文说明 Power BI 服务如何向其用户提供高可用性,以及提供业务连续性和灾难恢复。 阅读本文之后,应更好地了解如何实现高可用性、在什么情况下 Power BI 会执行故障转移以及在进行故障转移时服务预计会发生什么情况。
“高可用性”对于 Power BI 意味着什么?
Power BI 是完全托管的软件即服务 (SaaS)。 Power BI 可在发生基础结构故障时复原,从而使用户可以始终访问其报表。 有关 SLA 的信息,请参阅许可资源和文档。
Power BI 使用 Azure 可用性区域来保护 Power BI 报表、应用程序和数据免受数据中心故障的影响。 可用性区域会自动应用并用于 Power BI。 可用性区域是 Azure 区域内的故障隔离位置,可在具有冗余电源、冷却和网络的 Azure 区域内提供三个或更多的独特位置。 可用性区域允许 Power BI 客户运行关键应用程序,并提供更高的可用性和容错能力来应对数据中心故障。 可用性区域使客户能够经受数据中心故障而不触发 Power BI 故障转移。
有关详细信息,请参阅什么是 Azure 区域和可用性区域?
什么是 Power BI 故障转移?
Power BI 的故障转移行为因所使用的区域类型而异。
在 具有区域对的区域中,Power BI 维护 Azure 数据中心(也称为区域)中每个组件的多个实例,以确保业务连续性。 如果发生中断或 Power BI 在区域中无法访问或不可操作,则 Power BI 会使该区域中的所有组件都故障转移到备份实例。 故障转移会将可用性和可操作性还原到新区域中的 Power BI 服务实例(通常在同一地理位置)。 有关详细信息,请参阅 Microsoft Trust Center(Microsoft 信任中心)。
进行了故障转移的 Power BI 服务实例仅支持读取操作,这意味着以下操作在故障转移期间不受支持:刷新、报表发布操作、仪表板或报表修改以及其他需要对 Power BI 元数据进行更改的操作(例如在报表中插入注释)。 显示仪表板和显示报表(不基于 DirectQuery 或 Live Connect 到本地数据源)等读取操作仍然可以正常运行。
如果在没有区域对的区域中运行 Power BI 组件,可用性区域可提供复原能力。 数据不会复制到另一个区域,组件不会故障转移到另一个区域。
若要详细了解 Microsoft Fabric 如何支持可靠性,请参阅 Microsoft Fabric 中的可靠性。
备份实例如何与我的数据保持同步?
所有 Power BI 服务组件都定期同步其备份实例。 对于在 Power BI 中上传或更改的任何内容,存在 15 分钟的目标时间点同步。
如果区域中有区域对的故障转移,Power BI 使用 Azure 存储异地冗余复制和 Azure SQL 异地冗余复制来保证备份实例存在于其他区域中,并且可以使用。
在 没有区域对的区域中,Power BI 使用 Azure 存储区域冗余复制 和 Azure SQL 区域冗余在可用性区域之间复制数据。
若要详细了解 Microsoft Fabric 如何支持可靠性,请参阅 Microsoft Fabric 中的可靠性。
故障转移群集位于何处?
备份实例驻留在当组织注册 Power BI 时选择的相同地理位置(地区)处,在 Microsoft 信任中心中记录的情况除外。 一个地区可以包含多个区域,Microsoft 可能会将数据复制到特定地区中的任何区域以实现数据复原能力。 Microsoft 不会在地区外部复制或移动客户数据。 有关 Power BI 提供的地区与其中的区域的映射,请参阅 Microsoft 信任中心。
Microsoft 如何决定故障转移?
有两个不同的系统会在可能需要进行故障转移时进行指示:
- 外部和内部监视探测指示缺乏可用性或无法正常运行。 这类指示可能基于在 Power BI 组件中或是 Power BI 在区域中依赖的一个或多个服务中检测到的中断。
- Microsoft Azure 中心运营团队会报告某个区域中的严重中断。
在这两种情况下,Power BI 执行团队成员将决定进行故障转移。 此决定不是自动做出的。 做出此决定后,故障转移将自动执行。
如何知道 Power BI 处于故障转移模式?
会在 Power BI 支持页上发布通知。 通知信息包含不可用的主要操作,包括发布、刷新、创建仪表板、复制仪表板以及权限更改。
Power BI 进行故障转移需要多长时间?
对于区域故障转移,Power BI 可以在大约 30 秒内完成故障转移过程,并继续正常运行,且不受限制。 对于区域故障转移,在决定需要进行故障转移后,大约需要 15 分钟才能再次操作 Power BI。 确定需要故障转移所需的时间因导致故障转移的情况而异。
Power BI 使用 Azure 存储异地复制执行故障转移。 此类复制的返回点通常为 15 分钟,但 Power BI 也无法保证时间范围。 有关详细信息,请参阅 Azure 存储冗余。
如果高级容量不可用,工作区和报表会发生什么情况?
如果高级容量不可用,所有用户仍可以访问和查看工作区和报表。
我的 Power BI 实例何时返回原始区域?
当解决了导致故障转移的问题时,Power BI 服务实例会返回到其原始区域。 检查 Power BI 支持页:解决了问题时,Power BI 团队会删除描述故障转移的通知。 此时,运行应恢复为正常状态。
是否由我负责我的 Power BI 解决方案的可用性?
如果组织中使用的 Power BI 解决方案涉及以下元素之一,则必须采取措施来保证解决方案仍然高度可用:
- 如果组织使用 Power BI Premium,请确保调整高级容量大小以满足部署的负载要求。 若要帮助你规划和满足此要求,请参阅 Power BI Premium 规划和部署白皮书。 为了帮助进行监视,Power BI 的管理门户和 Power BI Premium Capacity Metrics 应用中会定期添加新功能。
- 如果组织使用本地数据网关访问本地数据源,则必须设置网关以支持高可用性,请参阅管理本地数据网关高可用性群集和负载均衡。 无论是在导入模式下刷新报表,还是在使用 DirectQuery 或 Live Connect 访问数据或数据模型,都请使用此指导进行操作。
在故障转移模式期间,网关是否会工作正常?
否。 需要本地数据源(基于直接查询和 Live Connect 的任何报表和仪表板)提供的数据不会在故障转移过程中起作用。 但是,网关配置不会更改。 当 Power BI 实例恢复为其原始状态时,网关会恢复为其正常功能。
如果主要区域中发生极端灾难,导致你无法在相当长的时间内还原网关,则故障转移的主要区域将允许读取和写入操作,以便你可以针对新区域重新部署和配置网关。
可以选择在另一台计算机上安装新网关,或者接管现有网关。 接管现有网关应该更为简单,因为与旧网关关联的所有数据源都将转移到新网关。