Поделиться через


Параметры запроса профиля распределения значений в столбцах (задача «Профилирование данных»)

Область применения: среда выполнения интеграции SSIS SQL Server в Фабрика данных Azure

Для установки параметров запроса профиля распределения значений столбцов , выделенного на панели запросов, используется панель Свойства запроса страницы Запросы профиля . Профиль распределения значений столбцов описывает все различные значения в выделенном столбце и указывает выраженную в процентах долю строк таблицы, представляемых каждым значением. Этот профиль может также указывать значения, превышающие указанную процентную долю строк в таблице. Этот профиль поможет выявить проблемы в данных, например неверное число уникальных значений в столбце. Например, при профилировании столбца штатов США можно обнаружить более 50 различных значений.

Примечание.

В этом разделе описываются параметры, расположенные на странице Запросы профиля в редакторе задачи «Профилирование данных». Дополнительные сведения об этой странице редактора см. в разделе Редактор задачи "Профилирование данных" (страница запросов профиля).

Дополнительные сведения об использовании задачи "Профилирование данных" см. в разделе Установка задачи "Профилирование данных". Дополнительные сведения об использовании средства просмотра профиля данных для анализа результатов задачи "Профилирование данных" см. в разделе Средство просмотра профиля данных.

Параметры области «Свойства запроса»

Для варианта Запрос профиля распределения значений столбцовна панели Свойства запроса отображаются следующие группы параметров.

  • Данные, куда входят параметры TableOrView и Column

  • Общие сведения

  • Параметры

Параметры данных

ConnectionManager
Выберите существующий диспетчер соединений ADO.NET, который использует поставщика данных .NET для SQL Server (SqlClient) для подключения к базе данных SQL Server, содержащей таблицу или представление для профилирования.

TableOrView
Выберите существующую таблицу или представление, содержащие столбец для профилирования.

Дополнительные сведения см. в подразделе «Параметры TableorView» данного раздела.

Столбец
Выберите существующий столбец для профилирования. Выберите (*), чтобы выполнить профилирование всех столбцов.

Дополнительные сведения см. в подразделе «Параметры столбца» данного раздела.

Параметры TableOrView

Схема
Указывает схему, которой принадлежит выбранная таблица. Этот параметр доступен только для чтения.

Таблицу
Отображает имя выбранной таблицы. Этот параметр доступен только для чтения.

Параметры столбцов

IsWildCard
Указывает, выбран ли подстановочный знак (*). Этот параметр принимает значение True, если выбран подстановочный знак (*) для профилирования всех столбцов. Значение False показывает, что для профилирования выбран отдельный столбец. Этот параметр доступен только для чтения.

ColumnName
Отображает имя выбранного столбца. Этот параметр пуст, если выбран подстановочный знак (*) для профилирования всех столбцов. Этот параметр доступен только для чтения.

StringCompareOptions
Выберите параметры для сравнения строковых значений. Это свойство имеет параметры, указанные в следующей таблице. По умолчанию значение этого параметра равно Default.

Примечание.

При использовании шаблона (*) для ColumnName поле CompareOptions доступно только для чтения и имеет значение по умолчанию.

значение Описание
По умолч. Сортирует и сравнивает данные на основе параметров сортировки столбца в исходной таблице.
BinarySort Сортирует и сравнивает данные на основе битовых шаблонов, определенных для каждого символа. Двоичный порядок сортировки учитывает регистр и диакритические знаки. Двоичный порядок сортировки является самым быстрым.
DictionarySort Сортирует и сравнивает данные в соответствии с правилами сортировки и сравнения, определенными в словарях для соответствующего языка или алфавита.

Если выбран вариант DictionarySort, можно дополнительно указать любое сочетание параметров, перечисленных в следующей таблице. По умолчанию эти дополнительные параметры не выбираются.

значение Описание
IgnoreCase Указывает, следует ли при сравнении различать символы в верхнем и нижнем регистре. Если параметр задан, то строковое сравнение игнорирует регистр. Например, «ABC» при сравнении не отличается от «abc».
IgnoreNonSpace Указывает, следует ли при сравнении различать обычные символы и символы с диакритическими знаками. Если параметр задан, то строковое сравнение не учитывает диакритические знаки. Например, "Ã¥" будет считаться обычным символом "a".
IgnoreKanaType Указывает, следует ли различать при сравнении два типа символов японской азбуки: хирагана и катакана. Если параметр задан, то строковое сравнение игнорирует тип японской азбуки.
IgnoreWidth Указывает, следует ли при сравнении различать однобайтовые символы или аналогичные двухбайтовые символы. Если параметр задан, то строковое сравнение рассматривает однобайтовое и двухбайтовое представления символа как один и тот же символ.

Общие параметры

RequestID
Введите описательное имя для этого запроса профиля. Обычно не нужно менять автоматически сформированное значение.

Параметры

ValueDistributionOption
Укажите, нужно ли вычислять распределение для всех значений столбца. По умолчанию значение этого параметра равно FrequentValues.

значение Описание
AllValues Распределение вычисляется для всех значений столбца.
FrequentValues Распределение вычисляется только для тех значений, частота которых превосходит минимальное значение, указанное параметром FrequentValueThreshold. Значения, не соответствующие параметру FrequentValueThreshold , исключаются из выходного отчета.

FrequentValueThreshold
Укажите пороговое значение (между 0 и 1), при превышении которого необходимо сообщать о значении столбца. Этот параметр отключен, если в качестве значения ValueDistributionOption выбрано AllValues. Значение этого параметра по умолчанию равно 0,001.

См. также

Редактор задачи «Профилирование данных» (страница «Общие»)
Форма быстрого профиля одной таблицы (задача «Профилирование данных»)