列值分布配置文件请求选项(数据事件探查任务)

使用**“配置文件请求”页的“请求属性”窗格为请求窗格中选定的“列值分布配置文件请求”**设置选项。列值分布配置文件将报告选定列中的所有非重复值以及表中每个值表示的行的百分比。该配置文件还可以报告其表示内容超过表中指定的行百分比的值。此配置文件可帮助您识别数据中的问题,例如,列中非重复值的数目不正确。例如,对表示美国州的列进行事件探查,发现有 50 多个非重复值。

注意注意

本主题中介绍的选项显示在“数据事件探查任务编辑器”“配置文件请求”页中。有关此编辑器页的详细信息,请参阅数据事件探查任务编辑器(“配置文件请求”页)

有关如何使用数据事件探查任务的详细信息,请参阅设置数据事件探查任务。有关如何使用数据配置文件查看器分析数据事件探查任务输出的详细信息,请参阅在数据配置文件查看器中查看配置文件输出

请求属性选项

对于**“列值分布配置文件请求”“请求属性”**窗格显示下列选项组:

  • Data,它包含 TableOrView 选项和 Column 选项

  • General

  • Options

Data 选项

  • ConnectionManager
    选择使用 .NET Data Provider for SQL Server (SqlClient) 的现有 ADO.NET 连接管理器连接到包含要进行事件探查的表或视图的 SQL Server 数据库。

  • TableOrView
    选择包含要进行事件探查的列的现有表或视图。

    有关详细信息,请参阅本主题中的“TableorView 选项”部分。

  • Column
    选择要进行事件探查的现有列。选择 (*) 可对所有列进行事件探查。

    有关详细信息,请参阅本主题中的“Column 选项”部分。

TableOrView 选项

  • Schema
    指定选定表所属的架构。此选项是只读的。

  • Table
    显示所选表的名称。此选项是只读的。

Column 选项

  • IsWildCard
    指定是否已选择通配符 (*)。如果您已选择 (*) 来对所有列进行事件探查,则此选项将设置为 True。如果已选择要对单个列进行事件探查,则为 False。此选项是只读的。

  • ColumnName
    显示所选列的名称。如果您已选择 (*) 来对所有列进行事件探查,则此选项为空白。此选项是只读的。

  • StringCompareOptions
    选择用于比较字符串值的选项。此属性具有下表所列的选项。此选项的默认值为 Default

    注意注意

    如果将 (*) 通配符用于 ColumnName,则 CompareOptions 为只读并设置为 Default 设置。

    说明

    Default

    根据源表中列的排序规则对数据进行排序和比较。

    BinarySort

    根据为每个字符所定义的位模式对数据进行排序和比较。二进制排序顺序既区分大小写,也区分重音。二进制排序顺序的速度也最快。

    DictionarySort

    根据关联语言或文字字典中定义的排序和比较规则对数据进行排序和比较。

    如果选择 DictionarySort,还可以选择下表中列出的任意选项组合。默认情况下,不会选择这些附加选项中的任何一个。

    说明

    IgnoreCase

    指定比较是否区分大小写字母。如果设置了此选项,字符串比较会忽略大小写。例如,"ABC" 和 "abc" 没有区别。

    IgnoreNonSpace

    指定比较是否区分空格字符和标注字符。如果设置了此选项,则比较会忽略标注字符。例如,"å" 与 "a" 相同。

    IgnoreKanaType

    指定比较是否区分日语的两种假名字符类型:平假名和片假名。如果设置了此选项,则字符串比较会忽略假名类型。

    IgnoreWidth

    指定比较是否区分字符的单字节形式和该字符的双字节形式。如果设置了此选项,字符串比较将把同一字符的单字节形式和双字节形式视为相同。

General 选项

  • RequestID
    键入一个标识此配置文件请求的描述性名称。通常无需更改自动生成的值。

Options 选项

  • ValueDistributionOption
    指定是否计算所有列值的分布。此选项的默认值为 FrequentValues

    说明

    AllValues

    计算所有列值的分布。

    FrequentValues

    仅计算其频率超出 FrequentValueThreshold 中指定的最小值的值的分布。

  • FrequentValueThreshold
    使用 0 到 1 之间的值指定阈值,超过该阈值将报告列值。当选择 AllValues 作为 ValueDistributionOption 时,将禁用此选项。此选项的默认值为 0.001。