数据模型表的各种类型

已完成

对于大多数 Excel 用户来说,创建数据模型是一种新概念。 在 Excel 中工作通常涉及到创建一个与 Excel 数据透视表和数据透视图组合使用的大型表,而使用 Power Query,新式分析人员可以创建一个包含单独的查找表、数据表和关系的数据模型。

以前在传统 Excel 中,需要使用 VLOOKUP()、INDEX() 或 MATCH() 函数将数据合并为一个大型表,以便创建数据透视表和数据透视图。

Excel 工作表同时包含“客户”和“报价”数据,形成含有行和列的一个大型表。

现在,你可以使用 Power Query 加载数据表,并创建包含关系的数据模型。

包含“客户”和“报价”表的数据模型示例。

任何时候将新的数据源添加到数据模型中,都需要确定数据在数据模型中要起的作用(是作为查找表数据还是数据表数据)。

查找表

查找表将包含用于对量化数据进行分类的定性方法。 可以使用它们来为数据透视表、数据透视图和可视化对象的行和列提供说明。

一个查找表的示例是一个名为“办事处”的表。 包含每个城市的相应县、省/市/自治区/直辖市和国家/地区信息的办公室。

带有 2 个表格的数据模型示例:“办事处”和“报价” - “报价、CountyID”到“报价、CountyID”的关系。

查找表需要遵循的一个重要规则是,它们必须包含一个非重复列,此列用来与其他表进行匹配以创建关系。

使用查找表时应遵循的一般准则:

  • 内容以文本为主。

  • 提供描述性信息,如名称、地址、国家/地区、城市和省/市/自治区/直辖市。

  • 不高的信息更新频率。

如果要将数据用于在数据透视表的行和/或列中创建标签,则大概率充当查找表数据。

数据表

数据表将包含与销售额、数量和报价金额之类的信息相关的量化数据。数据表需要具有一个与查找表相匹配的列,关系才能起作用。

一个数据表的例子是一个包含客户或办事处所有报价的表。 这些表应窄而长,应将定性信息尽可能多地转移到查找表。

关系能够让用户对数据表执行数学运算(Count、Sum、MIN、MAX),同时还让用户能够通过使用查找表中包含的详细信息将一个答案拆分为不同类别的数据。

使用数据表时应遵循的一般准则:

  • 以日期和数字为主。

  • 使用它们来执行数学运算(SUM、AVERAGE、MIN、MAX)。

  • 较高的信息更新频率(例如,每小时、每天或每周创建新销售额或报价)。

  • 将数据用于聚合,或充当数据透视表、数据透视图或其他可视化对象的值。