数据模型表类型

已完成

对于大多数 Excel 用户而言,创建数据模型的想法是一个全新的概念。 使用 Excel 通常需要创建一个大型表来与 Excel 数据透视表和数据透视图配合使用,而现代分析师可以使用 Power Query 创建具有单独的查找表、数据表和关系的数据模型。

以前在传统 Excel 中,需要使用 VLOOKUP()、INDEX() 或 MATCH() 函数将数据平展到一个大型表中,以便创建数据透视表和数据透视图。

Excel 工作表同时包含“客户”和“报价单”数据,形成含有行和列的一个大型表。

现在,您可以使用 Power Query 加载数据表,创建具有关系的数据模型。

包含“客户”和“报价单”表的数据模型示例。

任何时候将新的数据源添加到数据模型中时,都需要确定数据在数据模型中要起的作用(是作为查找表数据还是数据表数据)。

查找表

查找表将包含用于对量化数据进行分类的定性方法。 可以使用它们来为数据透视表、数据透视图和可视化的行和列提供描述。

查找表的一个示例是一个名为“Offices”的表,其中包括每个城市的对应县、州和国家/地区信息。

带有 2 个表的数据模型示例:“Offices”和“Quotes”-“Quotes, CountyID”到“Quotes, CountyID”的关系。

查找表需要遵循的一个重要规则是,它们必须包含一个非重复列,此列用来与其他表进行匹配以创建关系。

使用查找表时应遵循的一般准则:

  • 内容以文本为主。

  • 提供描述性信息,例如名称、地址、国家/地区、城市和省/自治区/直辖市。

  • 更新信息的频率不高。

如果要将数据用于在数据透视表的行和/或列中创建标签,则大概率充当查找表数据。

数据表

数据表将包括与销售金额、数量和报价单金额等信息相关的定量数据*。* 数据表需要有一个与查找表匹配的列,才能使关系正常工作。

一个数据表的示例是一个包含客户或办事处的所有报价单的表。 这些表应窄而长,应将定性信息尽可能多地转移到查找表。

关系能够让用户对数据表执行数学运算(Count、Sum、MIN、MAX),同时还让用户能够通过使用查找表中包含的详细信息将一个答案拆分为不同类别的数据。

使用数据表时应遵循的一般准则:

  • 以日期和数字为主。

  • 可用来做数学计算(SUM、AVERAGE、MIN、MAX)。

  • 信息更新频率较高(例如,每小时、每天或每周创建新销售或报价单)。

  • 将数据用于聚合,或充当数据透视表、数据透视图或其他可视化的值。