Поделиться через


Справка F1 средства просмотра профиля данных

Используйте средство просмотра профиля данных для просмотра выхода задачи «Профилирование данных».

Дополнительные сведения об использовании средства просмотра профиля данных см. в разделе Средство просмотра профиля данных. Дополнительные сведения об использовании задачи «Профилирование данных», создающей профиль, который можно проанализировать с помощью средства просмотра профиля данных, см. в разделе Установка задачи «Профилирование данных».

Статические параметры

  • Открыть
    Нажмите, чтобы просмотреть сохраненный файл, содержащий выход задачи «Профилирование данных»

  • Панель Профили
    Раскройте дерево на панели Профили, чтобы увидеть, какие профили включены в выход. Выберите профиль, чтобы посмотреть результаты для этого профиля.

  • Панель Сообщение
    Отображает сообщения о состоянии.

  • Панель Углубленная детализация
    Отображает строки данных, соответствующие значению выхода, если доступен источник данных, который использовался задачей «Профилирование данных».

    Например, при просмотре выхода профиля распределения значений столбцов для столбца US State, панель Подробное распределение значений может содержать строку «WA». Дважды щелкните строку на панели Подробное распределение значений, чтобы увидеть на панели детализации строки данных, в которых значением столбца штата является «WA».

Динамические параметры

Тип профиля = Профиль распределения длины столбцов

Профиль распределения длины столбцов — панель <столбец>

  • Минимальная длина
    Отображает минимальную длину значений в этом столбце.

  • Максимальная длина
    Отображает максимальную длину значений в этом столбце.

  • Без учета начальных пробелов
    Показывает, какое значение имело свойство IgnoreLeadingSpaces при вычислении этого профиля (True или False). Это свойство задается на странице Запросы профиля задачи «Профилирование данных».

  • Без учета конечных пробелов
    Показывает, какое значение имело свойство IgnoreTrailingSpaces при вычислении этого профиля (True или False). Это свойство задается на странице Запросы профиля задачи «Профилирование данных».

  • Число строк
    Отображает число строк в таблице или представлении.

Панель «Подробное распределение длины»

  • Длина
    Отображает длины столбцов, обнаруженные в профилируемом столбце.

  • Число
    Отображает число строк, в которых значение профилируемого столбца имело длину, указанную в столбце Длина.

  • Процент
    Отображает процент строк, в которых значение профилируемого столбца имело длину, указанную в столбце Длина.

Тип профиля = Профиль соотношения значений NULL в столбцах

Профиль соотношения значений NULL в столбцах — панель <столбец>

  • Количество значений NULL
    Отображает число строк, в которых профилируемый столбец содержит значение NULL.

  • Процент значений NULL
    Отображает процент строк, в которых профилируемый столбец содержит значение NULL.

  • Число строк
    Отображает число строк в таблице или представлении.

Тип профиля = Профиль шаблона столбцов

Профиль шаблона столбцов — панель <столбец>

  • Число строк
    Отображает число строк в таблице или представлении.

Панель «Распределение шаблонов»

  • Шаблон
    Отображает шаблоны, вычисляемые для профилируемого столбца.

  • Процент
    Отображает процент строк, значения которых соответствуют шаблону, отображаемому в столбце Шаблон.

Тип профиля = Профиль статистики столбцов

Профиль статистики столбцов — панель <столбец>

  • Минимум
    Отображает минимальное значение, обнаруженное в профилируемом столбце.

  • Максимум
    Отображает максимальное значение, обнаруженное в профилируемом столбце.

  • Среднее
    Отображает среднее значение по профилируемому столбцу.

  • Стандартное отклонение
    Отображает стандартное отклонение для значений профилируемого столбца.

Тип профиля = Профиль распределения значений столбцов

Профиль распределения значений столбцов — панель <столбец>

  • Количество различных значений
    Отображает число различных значений в профилируемом столбце.

  • Число строк
    Отображает число строк в таблице или представлении.

Панель «Подробное распределение значений»

  • Значение
    Отображает уникальные значения, обнаруженные в профилируемом столбце.

  • Число
    Отображает число строк, в которых профилируемый столбец имеет значение, указанное в столбце Значение.

  • Процент
    Отображает процент строк, в которых профилируемый столбец имеет значение, указанное в столбце Значение.

Тип профиля = Профиль потенциальных ключей

Профиль потенциальных ключей — панель <таблица>

  • Ключевые столбцы
    Отображает столбцы, которые были выбраны для профилирования, как потенциальные ключи.

  • Сила ключа
    Отображает силу (в процентах) потенциального ключевого столбца или сочетания столбцов. Сила ключа менее 100% означает наличие повторяющихся значений.

Панель «Нарушения ключа»

  • <столбец1>, <столбец2> и т. д.
    Отображает повторяющиеся значения, обнаруженные в профилируемом столбце.

  • Число
    Отображает число строк, в которых указанный столбец имеет значение, показанное в первом столбце.

Тип профиля = Профиль функциональной зависимости

Панель «Профиль функциональной зависимости»

  • Определяющие столбцы
    Отображает столбец или столбцы, выбранные в качестве определяющих. Например, поскольку одному почтовому индексу США всегда соответствует один и тот же штат, поле почтового индекса является определяющим.

  • Зависимые столбцы
    Отображает столбец или столбцы, выбранные в качестве зависимых. Например, поскольку одному почтовому индексу США всегда соответствует один и тот же штат, поле штата является зависимым.

  • Степень функциональной зависимости
    Отображает силу (в процентах) функциональной зависимости столбцов. Сила ключа менее 100% означает, что в некоторых случаях определяющее значение не определяет зависимое. В приведенном примере, где одному почтовому индексу США должен соответствовать один и тот же штат, это может свидетельствовать о недопустимости одного из значений штата.

Панель «Нарушения функциональной зависимости»

ПримечаниеПримечание

Высокий процент ошибочных значений данных может привести к непредвиденным результатам в профиле функциональной зависимости. Например, 90% строк могут содержать значение штата «WI» для почтового кода «98052». В профиле в качестве нарушения приведены строки с правильным значением штата «WA».

  • <имя определяющего столбца>
    Отображает значение определяющего столбца или сочетания столбцов для данного случая нарушения функциональной зависимости.

  • <имя зависимого столбца>
    Отображает значение зависимого столбца для данного случая нарушения функциональной зависимости.

  • Число несущего множества
    Отображает число строк, в которых определяющий столбец определяет зависимый столбец.

  • Число нарушений
    Отображает число строк, в которых определяющий столбец не определяет зависимый столбец. (Это строки, в которых зависимым является значение, показанное в столбце <имя зависимого столбца>.)

  • Процент несущего множества
    Отображает процент строк, в которых определяющий столбец определяет зависимый столбец.

Тип профиля = Профиль включения значений

Панель «Профиль включения значений»

  • Побочные столбцы подмножества
    Отображает столбец или сочетание столбцов, которые были профилированы для определения того, входят ли они в столбцы надмножества.

  • Побочные столбцы надмножества
    Отображает столбец или сочетание столбцов, которые были профилированы для определения того, включают ли они значения в столбцах подмножества.

  • Интенсивность включений
    Отображает силу (в процентах) перекрытия данных между столбцами. Сила ключа менее 100% означает, что в некоторых случаях значение в подмножестве не обнаружено среди значений в надмножестве.

Панель «Нарушения включения»

  • <столбец1>, <столбец2> и т. д.
    Отображает значения в столбце или столбцах подмножества, не обнаруженные в столбце или столбцах надмножества.

  • Число
    Отображает число строк, в которых указанный столбец имеет значение, показанное в первом столбце.

См. также

Основные понятия

Средство просмотра профиля данных

Задачи профилирования и просмотра данных