指定数据类型和内容类型(数据挖掘基础教程)

您已经选择了要用于生成结构和为模型定型的列,现在可以对向导设置的默认数据类型和内容类型进行任何必要的更改。

检查和修改每列的内容类型和数据类型

  1. 在**“指定列的内容和数据类型”页上,单击“检测”**运行用来确定每列的默认数据类型和内容类型的算法。

  2. 查看**“内容类型”“数据类型”**列中的各项;如有必要,请进行更改,以确保设置与下表所示一致。

    通常,向导会检测数值,并分配相应的数值数据类型;但有些情况下,您可能想要将数值作为文本处理。例如,GeographyKey 应作为文本处理,因为对此标识符进行数学运算是不对的。

    内容类型

    数据类型

    Address Line1

    Discrete

    Text

    Address Line2

    Discrete

    Text

    Age

    Continuous

    Long

    Bike Buyer

    Discrete

    Long

    Commute Distance

    Discrete

    Text

    CustomerKey

    Key

    Long

    DateLastPurchase

    Continuous

    Date

    Email Address

    Discrete

    Text

    English Education

    Discrete

    Text

    English Occupation

    Discrete

    Text

    FirstName

    Discrete

    Text

    Gender

    Discrete

    Text

    Geography Key

    Discrete

    Text

    House Owner Flag

    Discrete

    Text

    Last Name

    Discrete

    Text

    Marital Status

    Discrete

    Text

    Number Cars Owned

    Discrete

    Long

    Number Children At Home

    Discrete

    Long

    Region

    Discrete

    Text

    Total Children

    Discrete

    Long

    Yearly Income

    Continuous

    Double

  3. 单击**“下一步”**。