收集迁移到 Power BI 的要求

2025-01-23

本文介绍“阶段 1”，涉及在迁移到 Power BI 时收集要求和确定其优先级的过程。

关系图显示了 Power BI 迁移的阶段。本文重点介绍阶段 1。

注意

有关上图的完整说明，请参阅 Power BI 迁移概述。

阶段 1 的重点在于针对要迁移到 Power BI 的单个解决方案收集信息和进行规划。

阶段 1 的输出包括已确定优先级的详细要求。但是，必须完成阶段 2 和阶段 3 中的其他活动才能充分估计工作量。

重要

阶段 1 - 5 表示与一个特定解决方案相关的活动。组织/租户级别有一些决策和活动会影响解决方案级别的进程。 Power BI 迁移概述一文中介绍了其中一些较高级别的计划活动。适当时，应遵从组织级别的决策以提高效率和一致性。

Fabric 采用路线图介绍了这些类型的战略和策略注意事项。路线图侧重于组织采用。

提示

本文中讨论的大多数主题也适用于标准 Power BI 实现项目。

编译要求

在预迁移步骤中编译的现有 BI 项的清单，成为要在 Power BI 中创建的新解决方案要求的输入。收集要求是指了解当前状态以及在 Power BI 中重新设计报表时用户要更改或重构哪些项。提供详细的要求会非常有利于阶段 2 中的解决方案部署计划、阶段 3 中的概念证明创建过程以及阶段 4 中的生产就绪解决方案的创建。

收集报表要求

编译详尽、易于引用的报表信息，例如：

用途、受众和预期操作：确定适用于每个报表的用途和业务流程，以及报表使用者将采取的受众、分析工作流和预期操作。
使用者如何使用报表：请考虑与现有报表的报表使用者坐在一起，以确切地了解他们如何处理报表。你有可能获知可在新的 Power BI 版本中取消或改进哪些报表元素。此过程需要投入额外时间，但对于重要报表或经常使用的报表非常有价值。
所有者和主题专家：确定与报表或数据域关联的报表所有者和任何主题专家。他们今后可能会成为新的 Power BI 报表的所有者。包括任何特定的更改管理要求（通常在 IT 人员管理的解决方案和企业管理的解决方案之间有所不同）以及将来更改报表时需获取的批准和签核。有关详细信息，请参阅此文章。
内容交付方法：阐明报表使用者对内容交付的期望。交付的形式可有多种：按需、交互式执行、嵌入到自定义应用程序中或使用电子邮件订阅按计划交付。可能还会有触发警报通知的要求。
交互性需求：确定“必须满足”和“建议满足”的交互性要求，例如筛选器、向下钻取操作或钻取操作。
数据源：确保发现报表所需的所有数据源，并了解数据延迟需求（数据新鲜度）。确定每个报表的历史数据、趋势和数据快照要求，以便它们能够与数据要求保持一致。在以后使用源数据对新报表进行数据验证时，也可以借助数据源文档。
安全要求：阐明安全要求（例如允许的查看者、允许的编辑者和任何行级安全需求），包括正常组织安全性的任何例外。记录任何数据敏感级别、数据隐私或法规/符合性要求。
计算、KPI 和业务规则：识别和记录现有报表中当前定义的所有计算、KPI 和业务规则，以便它们符合数据要求。
可用性、布局和化妆品要求：确定与数据可视化、分组和排序要求以及条件可见性相关的特定可用性、布局和化妆品需求。包括与移动设备交付相关的任何特定注意事项。
打印和导出需求：确定是否存在特定于导出或打印就绪版式的要求。这些需求将对评估最合适的报表类型产生影响（例如 Power BI、Excel 或分页报表）。请注意，报表使用者往往非常倚赖于其一贯的行事和思考方式，因此不要害怕挑战他们的思维方式。请确保从增强功能而不是改变的角度进行探讨。
风险或担忧：确定报表是否有其他技术或功能要求，以及有关它们中提供的信息的任何风险或担忧。
未决问题和积压工作项：确定当前要添加到积压工作的任何将来的维护、已知问题或延迟的请求。

提示

考虑将要求归类为“必须满足”或“建议满足”，由此确定其优先级。通常，使用者会预先提出可能需要满足的所有要求，因为他们认为这可能是提出请求的唯一时机。此外，在多个迭代中处理优先级时，应使积压工作 (backlog) 可供利益干系人使用。这有助于进行通信、决策制定和跟踪待完成的承诺。

收集数据要求

编译与数据有关的详细信息，例如：

现有查询：确定是否存在可由 DirectQuery 模型或复合模型使用的现有报表查询或存储过程，或者是否可以转换为导入模型。
数据源类型：编译必要的数据源类型，包括集中式数据源（如企业数据仓库）以及非标准数据源（例如平面文件或用于增强企业数据源以用于报告目的的 Excel 文件）。考虑到数据网关连接性，查找数据源所在的位置也很重要。
数据结构和清理需求：确定每个必需数据源的数据结构，以及数据清理活动所需的程度。
数据集成：评估当有多个数据源时如何处理数据集成，以及如何在每个模型表之间定义关系。确定用于简化模型和减小其大小的特定数据元素。
可接受的数据延迟：确定每个数据源的数据延迟需求。它将影响有关使用哪些数据存储模式的决策。还应了解导入模型表的数据刷新频率。
数据量和可伸缩性：评估数据量预期，这将影响大型模型支持的决策以及设计 DirectQuery 或复合模型的决策。了解与历史数据需求相关的注意事项也很有必要。对于较大的语义模型，还需要确定增量数据刷新。
度量值、KPI 和业务规则：评估度量值、KPI 和业务规则的需求。它们将对有关逻辑应用时机的决策产生影响：是在语义模型还是数据集成过程中应用。
主数据和数据目录：考虑是否存在需要注意的主数据问题。确定与企业数据目录的集成对于提高可发现性、访问定义或生成组织接受的一致术语是否合适。
安全和数据隐私：确定语义模型是否存在任何特定的安全或数据隐私注意事项，包括行级别安全性要求。
打开问题和积压工作项：此时向积压工作添加任何已知问题、已知数据质量缺陷、将来维护或延迟请求。

重要

可以通过共享语义模型来实现数据可重用性，可选择对其进行认证，以指示可信度并提高可发现性。可以通过数据流来实现数据准备可重用性，以减少多个语义模型中的重复逻辑。数据流还可以显著减少源系统上的负载，因为检索数据的频率降低了，多个语义模型便可以从数据流导入数据。

确定改进可能性

在大多数情况下，可进行一些修正和改进。在不进行任何重构或改进的情况下，很少发生直接的一对一迁移。可以考虑三种类型的改进，包括：

合并报表：可以使用筛选器、书签或个性化等技术合并类似的报表。减少报表数量同时提升每个报表的灵活性可以显著改善报表使用者的体验。请考虑优化用于问答（自然语言查询）的语义模型，以便为报表使用者提供更大的灵活性，使他们能够创建自己的可视化效果。
效率改进：在需求收集过程中，通常可以识别出改进。例如，当分析人员手动编译数字或可以简化工作流的情况下。 Power Query 对于替换当前执行的手动活动，可以发挥重要作用。如果业务分析人员发现自己定期执行相同的活动来清理和准备数据，就可以借助可重复执行的 Power Query 数据准备步骤来大幅节省操作时间并减少错误。
集中化数据模型：权威和认证的语义模型充当托管自助服务 BI 的主干。在这种情况下，数据只需托管一次，分析人员可以灵活地使用和扩充这些数据，来满足报表和分析需求。

注意

有关数据模型集中化的详细信息，请参阅核心管控和边缘灵活性。

确定优先级并评估复杂性

在此阶段，有初始清单可用，可能包含特定的要求。在确定准备迁移的初始 BI 项集的优先级时，既要结合考虑报表和数据，又要分别考虑。

确定高优先级报表，其中可能包括以下报表：

为企业带来巨大价值的报表。
经常执行的报表。
高级领导或主管人员需要的报表。
涉及到合理复杂程度（在初始迁移迭代期间提高成功的可能性）的数据。

确定高优先级数据，其中可能包含以下数据：

包含关键数据元素的数据。
要在许多用例中使用的一般组织数据。
可用于创建供报表和多个报表创建者重复使用的共享语义模型充的数据。
涉及到合理复杂程度（在初始迁移迭代时提高成功的可能性）的数据。

在此 Power BI 迁移系列的下一篇文章中，了解阶段 2，该阶段要做的是规划单个 Power BI 解决方案的迁移。

其他有用的资源包括：

有经验的 Power BI 合作伙伴可帮助你的组织成功完成迁移过程。若要查找 Power BI 合作伙伴，请访问 Microsoft Power BI 合作伙伴门户。