Поделиться через


Средство просмотра профиля данных

Область применения: среда выполнения интеграции SSIS SQL Server в Фабрика данных Azure

Просмотр и анализ профилей данных — следующий шаг в процессе профилирования данных. Эти профили можно просмотреть после запуска задачи профилирования данных в пакете служб Integration Services и вычислить профили данных. Дополнительные сведения о настройке и использовании задач "Профилирование данных" см. в разделе Установка задачи "Профилирование данных".

Внимание

В выходном файле могут содержаться конфиденциальные данные о базе данных и о содержащихся в ней данных. Рекомендации по повышению защищенности этого файла см. в разделе Доступ к файлам, используемым пакетами.

Профили данных

Чтобы просмотреть профили данных, нужно настроить задачу «Профилирование данных» таким образом, чтобы ее выходные данные направлялись в файл, и затем использовать отдельное средство просмотра профиля данных. Чтобы открыть средство просмотра профиля данных, выполните одно из следующих действий.

  • Щелкните правой кнопкой мыши задачу профилирования данных в конструкторе служб SSIS и нажмите кнопку "Изменить". На странице Общиередактора задачи «Профилирование данных» нажмите кнопку Открыть средство просмотра профиля.

  • В папке <диск>:\Program Files (x86) | Program Files\Microsoft SQL Server\110\DTS\Binn запустите DataProfileViewer.exe.

Это средство просмотра отображает запрошенные профили и вычисляемые результаты в нескольких панелях и имеет дополнительную возможность выполнить углубленную детализацию и просмотреть подробные сведения.

ПанельПрофили
На панели Профили отображаются профили, запрошенные в задаче "Профилирование данных". Чтобы просмотреть вычисляемые результаты профиля, выделите профиль на панели Профили , и результаты отобразятся на других панелях средства просмотра.

Панель "Результаты"
На панели Результаты сводка вычисляемых результатов профиля отображается в одной строке. Так, при запросе Профиль распределения длины столбцов, в этой строке будут указаны минимальная длина и максимальная длина, а также число строк. Для большинства профилей эту строку можно выбрать на панели Результаты , чтобы просмотреть дополнительные сведения на дополнительной панели Сведения .

ПанельСведения
Для большинства типов профилей панель Сведения отображает дополнительную информацию о результатах профиля, выбранного на панели Результаты . Например, при запросе Профиль распределения длины столбцовна панели Сведения будет отображена длина каждого найденного столбца. На этой панели отображается также количество и выраженная в процентах доля строк, в которых значением столбца является длина столбца.

Для трех типов профилей, вычисляемых на основе более чем одного столбца ("Потенциальный ключ", "Функциональная зависимость" и "Включение значений"), на панели Сведения отображаются нарушения ожидаемой связи. Например, если пользователь запрашивает «Профиль потенциального ключа», на панели «Сведения» отображаются значения-дубликаты, нарушающие требование уникальности, которому должен удовлетворять потенциальный ключ.

Если доступен источник данных, используемый для вычисления профиля, можно дважды щелкнуть строку в панели Сведения , чтобы вывести соответствующие строки в панели Углубленная детализация .

ПанельУглубленная детализация
На панели Сведения можно дважды щелкнуть строку, чтобы увидеть соответствующие строки данных на панели Углубленная детализация , если выполняются следующие условия:

  • Доступен источник данных, который используется для вычисления профиля.

  • У пользователя имеется разрешение на просмотр данных.

Чтобы подключить базу данных-источник к запросу углубленной детализации, средство просмотра профиля данных использует проверку подлинности Windows и учетные данные текущего пользователя. Средство просмотра профиля данных не использует сведения о соединении, хранящиеся в пакете, который запустил задачу «Профилирование данных».

Внимание

Возможность углубленной детализации, которая доступна в средстве просмотра профиля данных, отправляет активные запросы к исходному источнику данных. Эти запросы могут отрицательно повлиять на производительность сервера.

Если детализация углублением выполняется из выходного файла, созданного некоторое время назад, запросы углубленной детализации могут возвратить набор строк, отличающихся от тех, на основе которых вычислялись первоначальные выходные данные.

Дополнительные сведения о пользовательском интерфейсе средства просмотра профилей данных см. в разделе Data Profile Viewer F1 Help.

Справка F1 средства просмотра профиля данных

Используйте средство просмотра профиля данных для просмотра выхода задачи «Профилирование данных».

Дополнительные сведения об использовании средства просмотра профиля данных см. в разделе Средство просмотра профиля данных. Дополнительные сведения об использовании задачи "Профилирование данных", создающей профиль, который можно проанализировать с помощью средства просмотра профиля данных, см. в разделе Установка задачи "Профилирование данных".

Статические параметры

Открыть
Нажмите, чтобы просмотреть сохраненный файл, содержащий выход задачи «Профилирование данных»

ПанельПрофили
Раскройте дерево на панели Профили , чтобы увидеть, какие профили включены в выход. Выберите профиль, чтобы посмотреть результаты для этого профиля.

Панель сообщений
Отображает сообщения о состоянии.

ПанельУглубленная детализация
Отображает строки данных, соответствующие значению выхода, если доступен источник данных, который использовался задачей «Профилирование данных».

Например, при просмотре выхода профиля распределения значений столбцов для столбца US State, панель Подробное распределение значений может содержать строку «WA». Дважды щелкните строку на панели Подробное распределение значений , чтобы увидеть на панели детализации строки данных, в которых значением столбца штата является "WA".

Динамические параметры

Тип профиля = Профиль распределения длины столбцов

Профиль распределения длины столбцов — панель <столбец>

Минимальная длина
Отображает минимальную длину значений в этом столбце.

Максимальная длина
Отображает максимальную длину значений в этом столбце.

Без учета начальных пробелов
Показывает, какое значение имело свойство IgnoreLeadingSpaces при вычислении этого профиля (True или False). Это свойство задается на странице Запросы профиля задачи «Профилирование данных».

Без учета конечных пробелов
Показывает, какое значение имело свойство IgnoreTrailingSpaces при вычислении этого профиля (True или False). Это свойство задается на странице Запросы профиля задачи «Профилирование данных».

Количество строк
Отображает число строк в таблице или представлении.

Панель «Подробное распределение длины»

Длина
Отображает длины столбцов, обнаруженные в профилируемом столбце.

Численность
Отображает число строк, в которых значение профилируемого столбца имело длину, указанную в столбце Длина .

Процент
Отображает процент строк, в которых значение профилируемого столбца имело длину, указанную в столбце Длина .

Тип профиля = Профиль соотношения значений NULL в столбцах

Профиль соотношения значений NULL в столбцах — панель <столбец>

Количество значений NULL
Отображает число строк, в которых профилируемый столбец содержит значение NULL.

Процент значений NULL
Отображает процент строк, в которых профилируемый столбец содержит значение NULL.

Количество строк
Отображает число строк в таблице или представлении.

Тип профиля = Профиль шаблона столбцов

Профиль шаблона столбца — панель <столбец>

Количество строк
Отображает число строк в таблице или представлении.

Панель «Распределение шаблонов»

Шаблон
Отображает шаблоны, вычисляемые для профилируемого столбца.

Процент
Отображает процент строк, значения которых соответствуют шаблону, отображаемому в столбце Шаблон .

Тип профиля = Профиль статистики столбцов

Профиль статистики столбцов — панель <столбец>

Минимум
Отображает минимальное значение, обнаруженное в профилируемом столбце.

Максимум
Отображает максимальное значение, обнаруженное в профилируемом столбце.

Среднее
Отображает среднее значение по профилируемому столбцу.

Стандартное отклонение
Отображает стандартное отклонение для значений профилируемого столбца.

Тип профиля = Профиль распределения значений столбцов

Профиль распределения значений столбцов — панель <столбец>

Количество различных значений
Отображает число различных значений в профилируемом столбце.

Количество строк
Отображает число строк в таблице или представлении.

Панель «Подробное распределение значений»

Value
Отображает уникальные значения, обнаруженные в профилируемом столбце.

Численность
Отображает число строк, в которых профилируемый столбец имеет значение, указанное в столбце Значение .

Процент
Отображает процент строк, в которых профилируемый столбец имеет значение, указанное в столбце Значение .

Тип профиля = Профиль потенциальных ключей

Профиль потенциальных ключей — панель <столбец>

Ключевые столбцы
Отображает столбцы, которые были выбраны для профилирования, как потенциальные ключи.

Сила ключа
Отображает силу (в процентах) потенциального ключевого столбца или сочетания столбцов. Сила ключа менее 100% означает наличие повторяющихся значений.

Панель «Нарушения ключа»

<столбец1>, <столбец2> и т. д.
Отображает повторяющиеся значения, обнаруженные в профилируемом столбце.

Численность
Отображает число строк, в которых указанный столбец имеет значение, показанное в первом столбце.

Тип профиля = Профиль функциональной зависимости

Панель «Профиль функциональной зависимости»

Определяющие столбцы
Отображает столбец или столбцы, выбранные в качестве определяющих. Например, поскольку одному почтовому индексу США всегда соответствует один и тот же штат, поле почтового индекса является определяющим.

Зависимые столбцы
Отображает столбец или столбцы, выбранные в качестве зависимых. Например, поскольку одному почтовому индексу США всегда соответствует один и тот же штат, поле штата является зависимым.

Степень функциональной зависимости
Отображает силу (в процентах) функциональной зависимости столбцов. Сила ключа менее 100% означает, что в некоторых случаях определяющее значение не определяет зависимое. В приведенном примере, где одному почтовому индексу США должен соответствовать один и тот же штат, это может свидетельствовать о недопустимости одного из значений штата.

Панель «Нарушения функциональной зависимости»

Примечание.

Высокий процент ошибочных значений данных может привести к непредвиденным результатам в профиле функциональной зависимости. Например, 90% строк имеют значение штата "WI" для почтового индекса "98052". Профиль сообщает о строках, содержащих правильное значение штата "WA", как о нарушениях.

<имя определяющего столбца>
Отображает значение определяющего столбца или сочетания столбцов для данного случая нарушения функциональной зависимости.

<имя зависимого столбца>
Отображает значение зависимого столбца для данного случая нарушения функциональной зависимости.

Число несущего множества
Отображает число строк, в которых определяющий столбец определяет зависимый столбец.

Число нарушений
Отображает число строк, в которых определяющий столбец не определяет зависимый столбец. (Это строки, в которых зависимым является значение, показанное в столбце <имя зависимого столбца>.)

Процент несущего множества
Отображает процент строк, в которых определяющий столбец определяет зависимый столбец.

Тип профиля = Профиль включения значений

Панель «Профиль включения значений»

Побочные столбцы подмножества
Отображает столбец или сочетание столбцов, которые были профилированы для определения того, входят ли они в столбцы надмножества.

Побочные столбцы надмножества
Отображает столбец или сочетание столбцов, которые были профилированы для определения того, включают ли они значения в столбцах подмножества.

Интенсивность включений
Отображает силу (в процентах) перекрытия данных между столбцами. Сила ключа менее 100% означает, что в некоторых случаях значение в подмножестве не обнаружено среди значений в надмножестве.

Панель «Нарушения включения»

<столбец1>, <столбец2> и т. д.
Отображает значения в столбце или столбцах подмножества, не обнаруженные в столбце или столбцах надмножества.

Численность
Отображает число строк, в которых указанный столбец имеет значение, показанное в первом столбце.