指定数据类型和内容类型(数据挖掘基础教程)
您已选择了用于生成结构和为模型定型的列,现在可以对向导设置的默认数据类型和内容类型进行任何必要的更改。
检查和修改每列的内容类型和数据类型
在**“指定列的内容和数据类型”页上,单击“检测”**运行用来确定每列的默认数据类型和内容类型的算法。
查看**“内容类型”和“数据类型”**列中的各项;如有必要,请进行更改,以确保设置与下表所示一致。
通常,向导会检测数值,并分配相应的数值数据类型;但有些情况下,您可能想要将数值作为文本处理。 例如,GeographyKey 应作为文本处理,因为对此标识符进行数学运算是不对的。
列
内容类型
数据类型
Address Line1
离散
Text
Address Line2
离散
Text
Age
连续
Long
Bike Buyer
离散
Long
Commute Distance
离散
Text
CustomerKey
键
Long
DateLastPurchase
连续
日期
Email Address
离散
Text
English Education
离散
Text
English Occupation
离散
Text
FirstName
离散
Text
Gender
离散
Text
Geography Key
离散
Text
House Owner Flag
离散
Text
Last Name
离散
Text
Marital Status
离散
Text
Number Cars Owned
离散
Long
Number Children At Home
离散
Long
Region
离散
Text
Total Children
离散
Long
Yearly Income
连续
Double
单击**“下一步”**。