Поделиться через


Редактор задачи «Профилирование данных» (страница «Запросы профиля»)

Страница «Запросы профиля»редактора задачи «Профилирование данных» используется для выбора и настройки профилей, которые необходимо вычислить. В рамках одной задачи «Профилирование данных» можно вычислить несколько профилей для нескольких столбцов или сочетаний столбцов из нескольких таблиц или представлений.

Дополнительные сведения об использовании задачи «Профилирование данных» см. в разделе Настройка задачи «Профилирование данных». Дополнительные сведения об использовании средства просмотра профиля данных для анализа результатов задачи «Профилирование данных» см. в разделе Просмотр выхода профиля в средстве просмотра профилей данных.

Открытие страницы «Запросы профиля» редактора задачи «Профилирование данных»

  1. В среде Business Intelligence Development Studio откройте пакет служб Integration Services, содержащий задачу «Профилирование данных».

  2. На вкладке Поток управления дважды щелкните задачу «Профилирование данных».

  3. В Редакторе задачи «Профилирование данных» выберите элемент Запросы профиля.

Использование области запросов

Область запросов отображается в верхней части страницы. В этой области перечислены все профили, настроенные для текущей задачи «Профилирование данных». Если не было настроено ни одного профиля, область остается пустой. Чтобы добавить новый профиль, щелкните пустую область под столбцом Тип профиля и выберите из списка тип профиля. Чтобы настроить профиль, выберите его в области запросов и задайте свойства профиля в области Свойства запроса.

Параметры области запросов

Область запросов имеет следующие параметры.

  • Просмотр
    Укажите, нужно ли просмотреть все профили, настроенные для задачи, или только один из этих профилей.

    Столбцы области запросов изменились в соответствии с выбранным вами параметром Просмотр. Дополнительные сведения о каждом из этих столбцов см. в следующем разделе «Столбцы области запросов».

Столбцы области запросов

В зависимости от выбранного параметра Просмотр в области запросов отображаются те или иные столбцы.

  • Если выбрать пункт Все запросы, в области запросов отображаются два столбца: Тип профиля и Идентификатор запроса.

  • Если выбрать просмотр одного из пяти профилей столбцов, в области запросов отображаются четыре столбца: Тип профиля, Таблица или представление, Столбец и Идентификатор запроса.

  • Если выбрать просмотр профиля потенциальных ключей, в области запросов отображаются четыре столбца: Тип профиля, Таблица или представление, Ключевые столбцы и Идентификатор запроса.

  • Если выбрать просмотр профиля функциональной зависимости, в области запросов отображаются пять столбцов: Тип профиля, Таблица или представление, Определяющие столбцы, Зависимый столбец и Идентификатор запроса.

  • Если выбрать просмотр профиля включения значений, в области запросов отображаются шесть столбцов: Тип профиля, Таблица или представление подмножества, Таблица или представление надмножества, Побочные столбцы подмножества, Побочные столбцы надмножества и Идентификатор запроса.

В следующих разделах описан каждый из этих столбцов.

Столбцы, участвующие во всех представлениях

  • Тип профиля
    Выберите один из следующих вариантов профиля данных:

    Значение

    Описание

    Запрос профиля потенциальных ключей

    Вычисление профиля потенциальных ключей.

    Этот профиль сообщает о том, является ли данный столбец или множество столбцов ключом или приблизительным ключом для выделенной таблицы. Этот профиль также поможет выявить проблемы в данных, например повторяющиеся значения в столбце потенциальных ключей.

    Запрос профиля распределения длины столбцов

    Вычисление профиля распределения длины столбцов.

    Профиль распределения длины столбцов описывает все различные длины строковых значений в выделенном столбце и указывает выраженную в процентах долю строк таблицы, представляемых каждым значением длины. Этот профиль поможет выявить проблемы в данных, например наличие недопустимых значений. Например, во время профилирования столбца с кодами штатов США, состоящими из двух символов, можно выявить значения длиной более двух символов.

    Запрос профиля соотношения значений NULL в столбцах

    Вычисление профиля соотношения значений NULL в столбцах.

    Профиль соотношения значений NULL в столбцах описывает выраженную в процентах долю значений NULL в выделенном столбце. Этот профиль поможет выявить проблемы в данных, например появление непредвиденно высокого процента значений NULL в некотором столбце. Например, во время профилирования столбца с почтовыми индексами можно обнаружить, что процент отсутствующих кодов неприемлемо велик.

    Запрос профиля шаблона столбцов

    Вычисление профиля шаблона столбцов.

    Профиль шаблона столбцов описывает набор регулярных выражений, которые покрывают указанный процент значений в строковом столбце. Этот профиль может помочь выявить проблемы в данных, такие как недопустимые строки. Этот профиль также предложит регулярные выражения, которые в дальнейшем можно будет использовать для проверки новых значений. Так, профиль шаблона столбца «Почтовый индекс» может дать следующие регулярные выражения: \d{5}-\d{4}, \d{5} и \d{9}. Если выводятся другие регулярные выражения, то в данных, скорее всего, содержатся недопустимые значения или значения в неверном формате.

    Запрос профиля статистики столбцов

    Выбрав этот параметр, можно вычислить профиль статистики столбцов с помощью значений по умолчанию для всех применимых столбцов в выделенной таблице или представлении.

    Профиль статистики столбцов описывает статистические показатели, такие как минимальное, максимальное, среднее и стандартное отклонение для числовых столбцов, а также минимальное и максимальное для столбцов типа datetime. Этот профиль может помочь выявить проблемы в данных, такие как недопустимые даты. Например, во время профилирования столбца исторических дат можно обнаружить, что максимальная дата находится в будущем.

    Запрос профиля распределения значений столбцов

    Вычисление профиля распределения значений столбцов.

    Профиль распределения значений столбцов описывает все различные значения в выделенном столбце и указывает выраженную в процентах долю строк таблицы, представляемых каждым значением. Этот профиль может также указывать значения, превышающие указанную процентную долю в таблице. Этот профиль поможет выявить проблемы в данных, например неверное число уникальных значений в столбце. Например, при профилировании столбца штатов США можно обнаружить более 50 различных значений.

    Запрос профиля функциональной зависимости

    Вычисление профиля функциональной зависимости.

    Профиль функциональной зависимости показывает, в какой степени значения в одном столбце (зависимом) зависят от значений в другом столбце или наборе столбцов (определяющем). Этот профиль также поможет выявить проблемы в данных, такие как недопустимые значения. Например, выполняется профилирование зависимости между столбцом почтовых индексов США и столбцом штатов США. Адреса с одним и тем же почтовым кодом должны быть расположены в одном и том же штате, однако профиль обнаружил нарушения этой зависимости.

    Запрос профиля включения значений

    Вычисление профиля включения значений.

    Профиль включения значений вычисляет перекрытие значений между двумя столбцами или наборами столбцов. Кроме того, данный профиль может определять, подходит ли столбец или набор столбцов для того, чтобы выступать в качестве внешнего ключа между выделенными таблицами. Этот профиль может также помочь выявить проблемы в данных, такие как недопустимые значения. Например, во время профилирования столбца ProductID таблицы Sales можно обнаружить, что этот столбец содержит значения, отсутствующие в столбце ProductID таблицы Products.

  • RequestID
    Показывает идентификатор запроса. Обычно автоматически сформированное значение менять не нужно.

Столбцы, общие для всех отдельных профилей

  • Диспетчер соединений
    Отображает диспетчер соединений ADO.NET, который подключается к исходной базе данных.

  • Идентификатор запроса
    Отображает идентификатор запроса. Обычно автоматически сформированное значение менять не нужно.

Столбцы, общие для профилей пяти отдельных столбцов

  • Таблица или представление
    Отображает таблицу или представление, содержащие выделенный столбец.

  • Столбец
    Отображает столбец, выделенный для профилирования.

Столбцы, характерные для профиля потенциальных ключей

  • Таблица или представление
    Отображает таблицу или представление, содержащие выбранные столбцы.

  • Ключевые столбцы
    Отображает столбцы, выделенные для профилирования.

Столбцы, характерные для профиля функциональной зависимости

  • Таблица или представление
    Отображает таблицу или представление, содержащие выбранные столбцы.

  • Определяющие столбцы
    Отображает столбцы, выделенные для профилирования в качестве определяющего столбца или столбцов. В примере, где почтовый индекс США определяет штат США, определяющим является столбец почтового индекса.

  • Зависимый столбец
    Отображает столбцы, выделенные для профилирования в качестве зависимого столбца. В примере, где почтовый индекс США определяет штат США, зависимым является столбец штата.

Столбцы, характерные для профиля включения значений

  • Таблица или представление подмножества
    Отображает таблицу или представление, содержащие столбец либо столбцы, выделенные как побочные столбцы подмножества.

  • Таблица или представление надмножества
    Отображает таблицу или представление, содержащие столбец либо столбцы, выделенные как побочные столбцы надмножества.

  • Побочные столбцы подмножества
    Отображает столбец или столбцы, выделенные для профилирования в качестве побочных столбцов подмножества. В примере, где необходимо удостовериться в том, что значения из столбца штатов США содержатся в ссылочной таблице двузначных кодов штатов США, столбцом подмножества является столбец штатов в исходной таблице.

  • Побочные столбцы надмножества
    Отображает столбец или столбцы, выделенные для профилирования в качестве побочных столбцов надмножества. В примере, где необходимо удостовериться в том, что значения из столбца штатов США содержатся в ссылочной таблице двузначных кодов штатов США, столбцом надмножества является столбец кодов штатов в ссылочной таблице.

Использование области свойств запроса

Область Свойства запроса отображается под областью запросов. В этой области отображаются параметры профиля, выделенного в области запросов.

ПримечаниеПримечание

Чтобы просмотреть свойства запроса профиля в области Свойства запроса, необходимо выбрать Тип профиля, а затем выбрать поле Идентификатор запроса.

Эти параметры различаются в зависимости от выделенного профиля. Сведения о параметрах отдельных типов профилей см. в следующих разделах: