指定数据类型和内容类型(数据挖掘基础教程)
您已经选择了要用于生成结构和为模型定型的列,现在可以对向导设置的默认数据类型和内容类型进行任何必要的更改。
检查和修改每列的内容类型和数据类型
在**“指定列的内容和数据类型”页上,单击“检测”**运行用来确定每列的默认数据类型和内容类型的算法。
查看**“内容类型”和“数据类型”**列中的各项;如有必要,请进行更改,以确保设置与下表所示一致。
通常,向导会检测数值,并分配相应的数值数据类型;但有些情况下,您可能想要将数值作为文本处理。例如,GeographyKey 应作为文本处理,因为对此标识符进行数学运算是不对的。
列
内容类型
数据类型
Address Line1
Discrete
Text
Address Line2
Discrete
Text
Age
Continuous
Long
Bike Buyer
Discrete
Long
Commute Distance
Discrete
Text
CustomerKey
Key
Long
DateLastPurchase
Continuous
Date
Email Address
Discrete
Text
English Education
Discrete
Text
English Occupation
Discrete
Text
FirstName
Discrete
Text
Gender
Discrete
Text
Geography Key
Discrete
Text
House Owner Flag
Discrete
Text
Last Name
Discrete
Text
Marital Status
Discrete
Text
Number Cars Owned
Discrete
Long
Number Children At Home
Discrete
Long
Region
Discrete
Text
Total Children
Discrete
Long
Yearly Income
Continuous
Double
单击**“下一步”**。