指定数据类型和内容类型(数据挖掘基础教程)

您已选择了用于生成结构和为模型定型的列,现在可以对向导设置的默认数据类型和内容类型进行任何必要的更改。

检查和修改每列的内容类型和数据类型

  1. 在**“指定列的内容和数据类型”页上,单击“检测”**运行用来确定每列的默认数据类型和内容类型的算法。

  2. 查看**“内容类型”“数据类型”**列中的各项;如有必要,请进行更改,以确保设置与下表所示一致。

    通常,向导会检测数值,并分配相应的数值数据类型;但有些情况下,您可能想要将数值作为文本处理。 例如,GeographyKey 应作为文本处理,因为对此标识符进行数学运算是不对的。

    内容类型

    数据类型

    Address Line1

    离散

    Text

    Address Line2

    离散

    Text

    Age

    连续

    Long

    Bike Buyer

    离散

    Long

    Commute Distance

    离散

    Text

    CustomerKey

    Long

    DateLastPurchase

    连续

    日期

    Email Address

    离散

    Text

    English Education

    离散

    Text

    English Occupation

    离散

    Text

    FirstName

    离散

    Text

    Gender

    离散

    Text

    Geography Key

    离散

    Text

    House Owner Flag

    离散

    Text

    Last Name

    离散

    Text

    Marital Status

    离散

    Text

    Number Cars Owned

    离散

    Long

    Number Children At Home

    离散

    Long

    Region

    离散

    Text

    Total Children

    离散

    Long

    Yearly Income

    连续

    Double

  3. 单击**“下一步”**。

课程中的下一个任务

为结构指定测试数据集(数据挖掘基础教程)

课程中的前一个任务

创建目标邮件挖掘模型结构(数据挖掘基础教程)

请参阅

概念

内容类型(数据挖掘)

数据类型(数据挖掘)