转换和映射数据
选择要使用的数据源后,您将进入 Power Query 编辑器。 查询编辑器是转换数据的强大工具。 要了解详细信息,请转到 Power Query 用户界面。
以下是您可能想要转换数据的一些原因:
您可能对记录的所有活动名称不感兴趣,因此您希望筛选对您尝试挖掘的流程很重要的特定活动名称。
您可能希望重命名一些活动名称以使其更具描述性和更易于理解。 数据库中的名称通常不是这种情况。
您可能只对特定的日期范围感兴趣,而不是对数据的整个历史记录感兴趣。
您可能希望组合多个 ID 列来组成一个案例 ID。 当您要用于流程挖掘的 ID 不存在或者是应用程序中多个 ID 的组合时,通常会执行此操作。 例如,当客户提交支持票证时,支持票证可能会分配给多个客户服务代理。 如果要分析每个代理如何处理每个票证,您需要将代理 ID 和票证 ID 组合为案例 ID。
筛选活动名称
选择活动名称列旁边的符号调出排序和筛选菜单。
如果有消息指出列表可能不完整,选择加载更多。
然后只选择要分析的活动名称。 取消选择要排除的任何名称。
或者,您可以使用文本筛选器菜单进行更高级的筛选。 有关按值筛选的详细信息,请转到按列中的值筛选。
重命名活动
- 确保选择了活动名称列。
- 在工具栏上方,选择转换选项卡。
- 在工具栏上,选择替换值。
- 在要查找的值下,键入数据源中显示的要替换的活动名称。
- 在替换为下,键入要在流程图中显示的活动名称。
- 对要替换的所有值重复此过程。
减少记录总数
减少记录总数的一个策略是仅使用最新记录。 为此,您需要首先按时间对数据进行排序。
选择 startTimestamp 列旁边的符号打开排序和筛选菜单。
要首先显示最近的记录,选择降序排序。
选择确定,然后选择工具栏上的保留行。
在行数下输入 150000。
选择确定筛选前 150,000 行。
合并多个 ID
您可以使用 Ctrl + 单击选择要合并的多个列。
- 在“转换”选项卡工具栏上,选择合并列。
- (可选)从下拉列表中选择一个分隔符。 或者,您可以选择无。
- 更改名称(或记下生成的默认名称),以可以在映射到案例 ID 时选择它。
映射数据
映射可告知流程挖掘功能哪个列映射到哪个属性类型(例如,案例 ID、活动名称或时间戳)。
- 要导航至映射屏幕,请选择下一步。
- 使用相应列旁边的下拉菜单选择其属性类型。 有关更多信息,请遵循属性类型描述。
- 当使用 CSV 文件格式从 Azure Data Lake Gen2 获取数据时,您可以使用数据类型列中的下拉菜单来更改导入的数据类型。 对于具有数值的列,考虑其属性是连续值(例如,发票金额设置为数字)还是分类值(例如,物料代码设置为文本)。
- 案例 ID、活动和开始时间戳是继续分析的强制属性。
- 要开始流程分析,请选择保存并分析。