数据事件探查任务编辑器(“配置文件请求”页)
使用**“数据事件探查任务编辑器”的“配置文件请求”**页来选择和配置需要计算的配置文件。在单个数据事件探查任务中,可以为多列或多个表或视图中的列组合计算多个配置文件。
有关如何使用数据事件探查任务的详细信息,请参阅设置数据事件探查任务。有关如何使用数据配置文件查看器分析数据事件探查任务输出的详细信息,请参阅在数据配置文件查看器中查看配置文件输出。
打开数据事件探查任务编辑器的“配置文件请求”页面
在 Business Intelligence Development Studio 中,打开具有该数据事件探查任务的 Integration Services 包。
在**“控制流”**选项卡上,双击该数据事件探查任务。
在**“数据事件探查任务编辑器”中,单击“配置文件请求”**。
使用请求窗格
请求窗格是出现在页顶部的窗格。此窗格将列出所有为当前数据事件探查任务配置的配置文件。如果尚未配置任何配置文件,则请求窗格为空。若要添加新的配置文件,请在**“配置文件类型”列下的空白区域单击,并从列表中选择配置文件类型。若要配置配置文件,请在请求窗格中选择配置文件,然后在“请求属性”**窗格中设置配置文件的属性。
请求窗格选项
请求窗格具有下列选项:
视图
选择查看为该任务配置的所有配置文件,还是仅查看其中的一个配置文件。请求窗格中的列会根据选择的**“视图”**而发生更改。有关这些列中各列的详细信息,请参阅下一节“请求窗格列”。
请求窗格列
请求窗格显示的列取决于选定的**“视图”**:
如果选择查看**“所有请求”,则请求窗格会显示两列:“配置文件类型”和“请求 ID”**。
如果选择查看五个列配置文件中的一个,则请求窗格会显示四列:“配置文件类型”、“表或视图”、“列”和“请求 ID”。
如果选择查看候选键配置文件,则请求窗格会显示四列:“配置文件类型”、“表或视图”、“键列”和“请求 ID”。
如果选择查看函数依赖关系配置文件,则请求窗格会显示五列:“配置文件类型”、“表或视图”、“决定列”、“依赖列”和“请求 ID”。
如果选择查看值包含配置文件,则请求窗格会显示六列:“配置文件类型”、“子集端表或视图”、“超集端表或视图”、“子集端列”、“超集端列”和“请求 ID”。
以下各节逐一介绍这些列。
所有视图的公共列
配置文件类型
从下面的选项选择一个数据配置文件:值
说明
候选键配置文件请求
计算候选键项配置文件。
此配置文件报告某个列或列集是选定表的键还是近似键。此配置文件还可以帮助您识别数据中的问题,如可能的键列中的重复值。
列长度分布配置文件请求
计算列长度分布配置文件。
列长度分布配置文件报告选定列中字符串值的所有不同长度以及每个长度所表示的表中的行的百分比。此配置文件可以帮助您识别数据中的问题,例如值无效。例如,在对以两个字符表示的美国州代码列进行事件探查,发现存在超过两个字符的值。
列 Null 比率配置文件请求
列 Null 比率配置文件。
列 Null 比率配置文件报告选定列中 null 值的百分比。此配置文件可以帮助您识别数据中的问题,例如,列中 null 值的比率意外偏高。例如,在对邮政编码列进行事件探查时发现,缺失的邮政编码所占的比例超出允许的范围。
列模式配置文件请求
计算列模式配置文件。
列模式配置文件报告涵盖字符串列中值的指定百分比的一组正则表达式。此配置文件可以帮助您识别数据中的问题,如无效字符串。它还可以建议可用于以后验证新值的正则表达式。例如,邮政编码列的模式配置文件可能会产生正则表达式 \d{5}-\d{4}、\d{5} 和 \d{9}。如果看到其他正则表达式,则数据可能包含无效或格式不正确的值。
列统计信息配置文件请求
选择此选项可使用选定表或视图中所有适用列的默认设置来计算列统计信息配置文件。
列统计信息配置文件报告的统计信息包括:例如,数值列的最小值、最大值、平均值和标准偏差以及 datetime 列的最小值和最大值。此配置文件可以帮助您识别数据中的问题,如无效值。例如,在对历史日期列进行事件探查时发现,最近的日期是一个将来的日期。
列值分布配置文件请求
计算列值分布配置文件。
列值分布配置文件报告选定列中所有的非重复值以及每个值所表示的表中的行的百分比。此配置文件还可以报告其表示内容超过表中指定的行百分比的值。此配置文件可帮助您识别数据中的问题,例如,列中非重复值的数目不正确。例如,在对包含美国各州的列进行事件探查时发现,其中存在 50 多个非重复值。
函数依赖关系配置文件请求
计算函数依赖关系配置文件。
函数依赖关系配置文件报告某列(依赖列)中的值依赖另一列或列集(决定列)中的值的程度。此配置文件还可以帮助您识别数据中的问题,如无效值。例如,您探查美国邮政编码列和美国的州列之间的依赖关系。同一邮政编码应始终对应同一州,但配置文件却发现有违反此依赖关系的情况。
值包含配置文件请求
计算值包含配置文件。
值包含配置文件计算两列或列集之间值的重叠。此配置文件还可以确定一个列或列集是否适于用作两个选定表之间的外键。此配置文件还可以帮助您识别数据中的问题,如无效值。例如,在对某个 Sales 表的 ProductID 列进行事件探查时发现,该列包含在 Products 表中 ProductID 列中找不到的值。
RequestID
显示请求的标识符。通常无需更改自动生成的值。
对所有单个配置文件都通用的列
连接管理器
显示连接到源数据库的 ADO.NET 连接管理器。请求 ID
显示请求的标识符。通常无需更改自动生成的值。
对五个单个列配置文件都通用的列
表或视图
显示包含所选列的表或视图。列
显示要进行事件探查的列。
特定于候选键配置文件的列
表或视图
显示包含所选列的表或视图。键列
显示要进行事件探查的列。
特定于函数依赖关系配置文件的列
表或视图
显示包含所选列的表或视图。决定列
显示选定要作为决定列进行事件探查的列。在美国邮政编码决定美国的州的示例中,决定列是邮政编码列依赖列
显示选定要作为依赖列进行事件探查的列。在美国邮政编码决定美国的州的示例中,依赖列是州列。
特定于值包含配置文件的列
子集端表或视图
显示包含选定作为子集端列的列的表或视图。超集端表或视图
显示包含选定作为超集端的列的表或视图。子集端列
显示选定要作为子集端列进行事件探查的列。在需要验证美国州列中的值是否可以在以两个字符表示的美国州代码的引用表中找到的示例中,子集列是源表中的州列。超集端列
显示选定要作为超集端列进行事件探查的列。在需要验证美国州列中的值是否可以在以两个字符表示的美国州代码的引用表中找到的示例中,超集列是引用表中的州代码列。
使用请求属性窗格
**“请求属性”**窗格显示在请求窗格下。此窗格显示在请求窗格中选定的用于配置文件的选项。
注意 |
---|
选择“配置文件类型”后,必须选择“请求 ID”字段查看“请求属性”中请求的配置文件的属性。 |
这些选项根据选定的配置文件而有所差异。有关单个配置文件类型选项的详细信息,请参阅下面主题: