Параметры запроса профиля распределения значений в столбцах (задача «Профилирование данных»)
Для установки параметров запроса профиля распределения значений столбцов, выделенного в области запросов, используется область Свойства запроса страницы Запросы профиля. Профиль распределения значений столбцов описывает все различные значения в выделенном столбце и указывает выраженную в процентах долю строк таблицы, представляемых каждым значением. Этот профиль может также указывать значения, превышающие указанную процентную долю строк в таблице. Этот профиль поможет выявить проблемы в данных, например неверное число уникальных значений в столбце. Например, при профилировании столбца штатов США можно обнаружить более 50 различных значений.
Примечание |
---|
В этом разделе описываются параметры, расположенные на странице Запросы профиля в редакторе задачи «Профилирование данных». Дополнительные сведения об этой странице редактора см. в разделе Редактор задачи «Профилирование данных» (страница «Запросы профиля»). |
Дополнительные сведения об использовании задачи «Профилирование данных» см. в разделе Настройка задачи «Профилирование данных». Дополнительные сведения об использовании средства просмотра профиля данных для анализа результатов задачи «Профилирование данных» см. в разделе Просмотр выхода профиля в средстве просмотра профилей данных.
Параметры области «Свойства запроса»
Для варианта Запрос профиля распределения значений столбцов в области Свойства запроса отображаются следующие группы параметров.
Данные, куда входят параметры TableOrView и Column
General
Параметры
Параметры данных
ConnectionManager
Выберите существующий диспетчер соединений ADO.NET, использующий поставщик данных .NET для SQL Server (SqlClient) для подключения к базе данных SQL Server, которая содержит таблицу или представление для профилирования.TableOrView
Выберите существующую таблицу или представление, содержащие столбец для профилирования.Дополнительные сведения см. в подразделе «Параметры TableorView» в этом разделе.
Column
Выберите существующий столбец для профилирования. Выберите (*), чтобы выполнить профилирование всех столбцов.Дополнительные сведения см. в подразделе «Параметры Column» данного раздела.
Параметры TableOrView
Schema
Указывает схему, которой принадлежит выбранная таблица. Этот параметр доступен только для чтения.Table
Отображает имя выбранной таблицы. Этот параметр доступен только для чтения.
Параметры столбца
IsWildCard
Указывает, выбран ли символ-шаблон (*). Этот параметр принимает значение True, если выбран шаблон (*), означающий профилирование всех столбцов. Значение False показывает, что для профилирования выбран отдельный столбец. Этот параметр доступен только для чтения.ColumnName
Отображает имя выбранного столбца. Этот параметр пуст, если выбран шаблон (*), означающий профилирование всех столбцов. Этот параметр доступен только для чтения.StringCompareOptions
Выберите параметры для сравнения строковых значений. Это свойство имеет параметры, указанные в следующей таблице. По умолчанию значение этого параметра равно Default.Примечание При использовании шаблона (*) для параметра ColumnName поле CompareOptions доступно только для чтения и имеет настройку По умолчанию.
Значение
Описание
Default
Сортирует и сравнивает данные на основе параметров сортировки столбца в исходной таблице.
BinarySort
Сортирует и сравнивает данные на основе битовых шаблонов, определенных для каждого символа. Двоичный порядок сортировки учитывает регистр и диакритические знаки. Двоичный порядок сортировки является самым быстрым.
DictionarySort
Сортирует и сравнивает данные в соответствии с правилами сортировки и сравнения, определенными в словарях для соответствующего языка или алфавита.
Если выбран вариант DictionarySort, можно дополнительно указать любое сочетание параметров, перечисленных в следующей таблице. По умолчанию ни один из этих дополнительных параметров не выбран.
Значение
Описание
IgnoreCase
Указывает, следует ли при сравнении различать символы в верхнем и нижнем регистре. Если параметр задан, то строковое сравнение игнорирует регистр. Например, «ABC» при сравнении не отличается от «abc».
IgnoreNonSpace
Указывает, следует ли при сравнении различать обычные символы и символы с диакритическими знаками. Если параметр задан, то строковое сравнение игнорирует диакритические знаки. Например, буква «a» с любыми диакритическими знаками будет считаться обычной буквой «a».
IgnoreKanaType
Указывает, следует ли различать при сравнении два типа символов японской азбуки: хирагана и катакана. Если параметр задан, то строковое сравнение игнорирует тип японской азбуки.
IgnoreWidth
Указывает, следует ли при сравнении различать однобайтовые символы или аналогичные двухбайтовые символы. Если параметр задан, то строковое сравнение рассматривает однобайтовое и двухбайтовое представления символа как один и тот же символ.
Общие параметры
- RequestID
Введите описательное имя для этого запроса профиля. Обычно автоматически сформированное значение менять не нужно.
Параметры
ValueDistributionOption
Укажите, нужно ли вычислять распределение для всех значений столбца. По умолчанию значение этого параметра равно FrequentValues.Значение
Описание
AllValues
Распределение вычисляется для всех значений столбца.
FrequentValues
Распределение вычисляется только для тех значений, частота которых превосходит минимальное значение, указанное параметром FrequentValueThreshold.
FrequentValueThreshold
Укажите пороговое значение (между 0 и 1), при превышении которого необходимо сообщать о значении столбца. Этот параметр отключен, если в качестве значения ValueDistributionOption выбрано AllValues. Значение этого параметра по умолчанию равно 0,001.