Поделиться через


Редактор задачи «Профилирование данных» (страница «Запросы профиля»)

Область применения: среда выполнения интеграции SSIS SQL Server в Фабрика данных Azure

Страница «Запросы профиля»редактора задачи «Профилирование данных» используется для выбора и настройки профилей, которые необходимо вычислить. В рамках одной задачи «Профилирование данных» можно вычислить несколько профилей для нескольких столбцов или сочетаний столбцов из нескольких таблиц или представлений.

Дополнительные сведения об использовании задачи "Профилирование данных" см. в разделе Установка задачи "Профилирование данных". Дополнительные сведения об использовании средства просмотра профиля данных для анализа результатов задачи "Профилирование данных" см. в разделе Средство просмотра профиля данных.

Открытие страницы «Запросы профиля» редактора задачи «Профилирование данных»

  1. В SQL Server Data Tools (SSDT) откройте пакет служб Integration Services с задачей профилирования данных.

  2. На вкладке Поток управления дважды щелкните задачу "Профилирование данных".

  3. В Редакторе задачи «Профилирование данных»выберите элемент Запросы профиля.

Использование панели запросов

Панель запросов отображается в верхней части страницы. На этой панели перечислены все профили, настроенные для текущей задачи «Профилирование данных». Если не было настроено ни одного профиля, панель остается пустой. Чтобы добавить новый профиль, щелкните пустую область под столбцом Тип профиля и выберите из списка тип профиля. Чтобы настроить профиль, выберите его на панели запросов и задайте свойства профиля на панели Свойства запроса .

Параметры панели запросов

Панель запросов имеет следующие параметры.

Представление
Укажите, нужно ли просмотреть все профили, настроенные для задачи, или только один из этих профилей.

Столбцы панели запросов изменились в соответствии с выбранным вами параметром Просмотр . Дополнительные сведения о каждом из этих столбцов см. в следующем разделе «Столбцы панели запросов».

Столбцы панели запросов

В зависимости от выбранного параметра Просмотр на панели запросов отображаются те или иные столбцы.

  • Если выбрать пункт Все запросы, на панели запросов отображаются два столбца: Тип профиля и Идентификатор запроса.

  • Если выбрать просмотр одного из пяти профилей столбцов, на панели запросов отображаются четыре столбца: Тип профиля, Таблица или представление, Столбеци Идентификатор запроса.

  • Если выбрать просмотр профиля потенциальных ключей, на панели запросов отображаются четыре столбца: Тип профиля, Таблица или представление, KeyColumnsи Идентификатор запроса.

  • Если выбрать просмотр профиля функциональной зависимости, на панели запросов отображаются пять столбцов: Тип профиля, Таблица или представление, Определяющие столбцы, Зависимый столбеци Идентификатор запроса.

  • Если выбрать просмотр профиля включения значений, на панели запросов отображаются шесть столбцов: Тип профиля, Таблица или представление подмножества, Побочное представление или таблица надмножества, Побочные столбцы подмножества, Побочные столбцы надмножестваи Идентификатор запроса.

В следующих разделах описан каждый из этих столбцов.

Столбцы, участвующие во всех представлениях

Тип профиля
Выберите один из следующих вариантов профиля данных:

значение Описание
Запрос профиля потенциальных ключей Вычисление профиля потенциальных ключей.

Этот профиль сообщает о том, является ли данный столбец или множество столбцов ключом или приблизительным ключом для выделенной таблицы. Этот профиль также поможет выявить проблемы в данных, например повторяющиеся значения в потенциальном ключевом столбце.
Запрос профиля распределения длины столбцов Вычисление профиля распределения длины столбцов.

Профиль распределения длины столбцов описывает все различные длины строковых значений в выделенном столбце и указывает выраженную в процентах долю строк таблицы, представляемых каждым значением длины. Этот профиль поможет выявить проблемы в данных, например наличие недопустимых значений. Например, во время профилирования столбца с кодами штатов США, состоящими из двух символов, можно выявить значения длиной более двух символов.
Запрос профиля соотношения значений NULL в столбцах Вычисление профиля соотношения значений NULL в столбцах.

Профиль соотношения значений NULL в столбцах описывает выраженную в процентах долю значений NULL в выделенном столбце. Этот профиль поможет выявить проблемы в данных, например появление непредвиденно высокого процента значений NULL в некотором столбце. Например, во время профилирования столбца с почтовыми индексами обнаружено, что процент отсутствующих кодов неприемлемо велик.
Запрос профиля шаблона столбцов Вычисление профиля шаблона столбцов.

Профиль шаблона столбцов описывает набор регулярных выражений, которые покрывают указанный процент значений в строковом столбце. Этот профиль может помочь выявить проблемы в данных, такие как недопустимые строки. Этот профиль также предложит регулярные выражения, которые в дальнейшем можно будет использовать для проверки новых значений. Так, профиль шаблона столбца "Почтовый индекс" может дать следующие регулярные выражения: \d{5}-\d{4}, \d{5} и \d{9}. Если выводятся другие регулярные выражения, то скорее всего, в данных содержатся недопустимые значения или значения в неверном формате.
Запрос профиля статистики столбцов Выбрав этот параметр, можно вычислить профиль статистики столбцов с помощью значений по умолчанию для всех применимых столбцов в выделенной таблице или представлении.

Профиль статистики столбцов описывает статистические показатели, такие как минимальное, максимальное, среднее и стандартное отклонение для числовых столбцов, а также минимальное и максимальное для столбцов типа datetime . Этот профиль может помочь выявить проблемы в данных, такие как недопустимые даты. Например, во время профилирования столбца исторических дат обнаружена самая поздняя дата, расположенная в будущем.
Запрос профиля распределения значений столбцов Вычисление профиля распределения значений столбцов.

Профиль распределения значений столбцов описывает все различные значения в выделенном столбце и указывает выраженную в процентах долю строк таблицы, представляемых каждым значением. Этот профиль может также указывать значения, превышающие указанную процентную долю в таблице. Этот профиль поможет выявить проблемы в данных, например неверное число уникальных значений в столбце. Например, при профилировании столбца штатов США можно обнаружить более 50 различных значений.
Запрос профиля функциональной зависимости Вычисление профиля функциональной зависимости.

Профиль функциональной зависимости показывает, в какой степени значения в одном столбце (зависимом) зависят от значений в другом столбце или наборе столбцов (определяющем). Этот профиль также поможет выявить проблемы в данных, например наличие недопустимых значений. Например, выполняется профилирование зависимости между столбцом почтовых индексов США и столбцом штатов США. Адреса с одним и тем же почтовым кодом должны быть расположены в одном и том же штате, однако профиль обнаружил нарушения этой зависимости.
Запрос профиля включения значений Вычисление профиля включения значений.

Профиль включения значений вычисляет перекрытие значений между двумя столбцами или наборами столбцов. Кроме того, данный профиль может определять, подходит ли столбец или набор столбцов для того, чтобы выступать в качестве внешнего ключа между выделенными таблицами. Этот профиль может также помочь выявить проблемы в данных, такие как недопустимые значения. Например, во время профилирования столбца ProductID таблицы Sales обнаружено, что этот столбец содержит значения, отсутствующие в столбце ProductID таблицы Products.

RequestID
Показывает идентификатор запроса. Обычно не нужно менять автоматически сформированное значение.

Столбцы, общие для всех отдельных профилей

Диспетчер соединений
Отображает диспетчер соединений ADO.NET, который подключается к исходной базе данных.

Код запроса
Отображает идентификатор запроса. Обычно не нужно менять автоматически сформированное значение.

Столбцы, общие для профилей пяти отдельных столбцов

Таблица или представление
Отображает таблицу или представление, содержащие выделенный столбец.

Столбец
Отображает столбец, выделенный для профилирования.

Столбцы, характерные для профиля потенциальных ключей

Таблица или представление
Отображает таблицу или представление, содержащие выбранные столбцы.

Ключевые столбцы
Отображает столбцы, выделенные для профилирования.

Столбцы, характерные для профиля функциональной зависимости

Таблица или представление
Отображает таблицу или представление, содержащие выбранные столбцы.

Определяющие столбцы
Отображает столбцы, выделенные для профилирования в качестве определяющего столбца или столбцов. В примере, где почтовый индекс США определяет штат США, определяющим является столбец почтового индекса.

Dependent column
Отображает столбцы, выделенные для профилирования в качестве зависимого столбца. В примере, где почтовый индекс США определяет штат США, зависимым является столбец штата.

Столбцы, характерные для профиля включения значений

Таблица или представление подмножества
Отображает таблицу или представление, содержащие столбец либо столбцы, выделенные как побочные столбцы подмножества.

Побочное представление или таблица надмножества
Отображает таблицу или представление, содержащие столбец либо столбцы, выделенные как побочные столбцы надмножества.

Побочные столбцы подмножества
Отображает столбец или столбцы, выделенные для профилирования в качестве побочных столбцов подмножества. В примере, где необходимо удостовериться в том, что значения из столбца штатов США содержатся в ссылочной таблице двузначных кодов штатов США, столбцом подмножества является столбец штатов в исходной таблице.

Побочные столбцы надмножества
Отображает столбец или столбцы, выделенные для профилирования в качестве побочных столбцов надмножества. В примере, где необходимо удостовериться в том, что значения из столбца штатов США содержатся в ссылочной таблице двузначных кодов штатов США, столбцом надмножества является столбец кодов штатов в ссылочной таблице.

Использование панели свойств запроса

Панель Свойства запроса отображается под панелью запросов. На этой панели отображаются параметры профиля, выделенного на панели запросов.

Примечание.

Чтобы просмотреть свойства запроса профиля на панели Свойства запроса, необходимо выбрать Тип профиля , а затем выбрать поле Идентификатор запроса .

Эти параметры различаются в зависимости от выделенного профиля. Сведения о параметрах отдельных типов профилей см. в следующих разделах:

См. также

Редактор задачи «Профилирование данных» (страница «Общие»)
Форма быстрого профиля одной таблицы (задача «Профилирование данных»)