数据处理入门

已完成

数据集是按行和列组织的数据集合,通常称为表。 行也称为记录,列也称为字段。 数据点组成数据集中的字段,这些字段通常包含不同类型的数据:

  • 临时数据 - 临时数据是针对某个事件保留的日期,例如下达订货或发货时间。 日期有自然顺序,我们知道 2021 年 12 月 24 日在 2021 年 12 月 25 日之前并在 2021 年 12 月 23 日之后。 由于这种自然顺序,可以轻松地随时间推移度量值。

  • 字符串数据 - 文本值也称为字符或字符串数据,通常归类为分类数据。 这是因为它描述了数据集中的记录类别。 例如,员工的姓名将存储为字符串数据。

  • 数值数据 - 数值数据或数字,可以分类为连续或离散数据。 连续数据是按比例度量的,而离散数据是计数不是度量值。 根据数值列中的值,此类型可作为类别。

在分析数据集中的数据之前,务必要理解数据。 然后,可以选择正确的分析函数来应用于正在处理的数据类型。

在此视频中,你将看到数据集示例,以及不同类型的日期、字符串和数值字段如何合并为行和列。 然后,了解如何对数据集进行分析,以理解数据中的模式: