Поделиться через


Справка F1 средства просмотра профиля данных

Используйте средство просмотра профиля данных для просмотра выхода задачи «Профилирование данных».

Дополнительные сведения об использовании средства просмотра профиля данных см. в разделе Просмотр выхода профиля в средстве просмотра профилей данных. Дополнительные сведения об использовании задачи «Профилирование данных», создающей профиль, который можно проанализировать с помощью средства просмотра профиля данных, см. в разделе Настройка задачи «Профилирование данных».

Статические параметры

  • Открыть
    Нажмите, чтобы просмотреть сохраненный файл, содержащий выход задачи «Профилирование данных»

  • Область Профили
    Раскройте дерево в области Профили, чтобы увидеть, какие профили включены в выход. Выберите профиль, чтобы просмотреть результаты для этого профиля.

  • Область Сообщение
    Отображает сообщения о состоянии.

  • Область Углубленная детализация
    Отображает строки данных, соответствующие значению выхода, если доступен источник данных, который использовался задачей «Профилирование данных».

    Например, при просмотре выхода профиля распределения значений столбцов для столбца US State, область Подробное распределение значений может содержать строку «WA». Дважды щелкните строку в области Подробное распределение значений, чтобы увидеть в области углубленной детализации строки данных, в которых значением столбца штата является «WA».

Динамические параметры

Тип профиля = Профиль распределения длины столбцов

Профиль распределения длины столбцов — область <столбец>

  • Минимальная длина
    Отображает минимальную длину значений в этом столбце.

  • Максимальная длина
    Отображает максимальную длину значений в этом столбце.

  • Без учета начальных пробелов
    Показывает, какое значение имело свойство IgnoreLeadingSpaces при вычислении этого профиля (True или False). Это свойство задается на странице Запросы профиля задачи «Профилирование данных».

  • Без учета конечных пробелов
    Показывает, какое значение имело свойство IgnoreTrailingSpaces при вычислении этого профиля (True или False). Это свойство задается на странице Запросы профиля задачи «Профилирование данных».

  • Число строк
    Отображает число строк в таблице или представлении.

Область «Подробное распределение длины»

  • Длина
    Отображает длины столбцов, обнаруженные в профилируемом столбце.

  • Число
    Отображает число строк, в которых значение профилируемого столбца имело длину, указанную в столбце Длина.

  • Процент
    Отображает процент строк, в которых значение профилируемого столбца имело длину, указанную в столбце Длина.

Тип профиля = Профиль соотношения значений NULL в столбцах

Профиль соотношения значений NULL в столбцах — область <столбец>

  • Количество значений NULL
    Отображает число строк, в которых профилируемый столбец содержит значение NULL.

  • Процент значений NULL
    Отображает процент строк, в которых профилируемый столбец содержит значение NULL.

  • Число строк
    Отображает число строк в таблице или представлении.

Тип профиля = Профиль шаблона столбцов

Профиль шаблона столбцов — область <столбец>

  • Число строк
    Отображает число строк в таблице или представлении.

Область «Распределение шаблонов»

  • Шаблон
    Отображает шаблоны, вычисляемые для профилируемого столбца.

  • Процент
    Отображает процент строк, значения которых соответствуют шаблону, отображаемому в столбце Шаблон.

Тип профиля = Профиль статистики столбцов

Профиль статистики столбцов — область <столбец>

  • Минимум
    Отображает минимальное значение, обнаруженное в профилируемом столбце.

  • Максимум
    Отображает максимальное значение, обнаруженное в профилируемом столбце.

  • Среднее
    Отображает среднее значение, обнаруженное в профилируемом столбце.

  • Стандартное отклонение
    Отображает стандартное отклонение для значений профилируемого столбца.

Тип профиля = Профиль распределения значений столбцов

Профиль распределения значений столбцов — область <столбец>

  • Количество различных значений
    Отображает число различных значений в профилируемом столбце.

  • Число строк
    Отображает число строк в таблице или представлении.

Область «Подробное распределение значений»

  • Значение
    Отображает уникальные значения, обнаруженные в профилируемом столбце.

  • Число
    Отображает число строк, в которых профилируемый столбец имеет значение, указанное в столбце Значение.

  • Процент
    Отображает процент строк, в которых профилируемый столбец имеет значение, указанное в столбце Значение.

Тип профиля = Профиль потенциальных ключей

Профиль потенциальных ключей — область <таблица>

  • Ключевые столбцы
    Отображает столбцы, которые были выбраны для профилирования, как потенциальные ключи.

  • Стойкость ключа
    Отображает силу (в процентах) потенциального ключевого столбца или сочетания столбцов. Стойкость ключа менее 100% означает наличие повторяющихся значений.

Область «Нарушения ключа»

  • <столбец1>, <столбец2> и т. д.
    Отображает повторяющиеся значения, обнаруженные в профилируемом столбце.

  • Число
    Отображает число строк, в которых указанный столбец имеет значение, показанное в первом столбце.

Тип профиля = Профиль функциональной зависимости

Область «Профиль функциональной зависимости»

  • Определяющие столбцы
    Отображает столбец или столбцы, выбранные в качестве определяющих. Например, поскольку одному почтовому индексу США всегда соответствует один и тот же штат, поле почтового индекса является определяющим.

  • Зависимые столбцы
    Отображает столбец или столбцы, выбранные в качестве зависимых. Например, поскольку одному почтовому индексу США всегда соответствует один и тот же штат, поле штата является зависимым.

  • Степень функциональной зависимости
    Отображает силу (в процентах) функциональной зависимости столбцов. Стойкость ключа менее 100% означает, что в некоторых случаях определяющее значение не определяет зависимое. В приведенном примере, где одному почтовому индексу США должен соответствовать один и тот же штат, это может свидетельствовать о недопустимости одного из значений штата.

Область «Нарушения функциональной зависимости»

ПримечаниеПримечание

Высокий процент ошибочных значений данных может привести к непредвиденным результатам в профиле функциональной зависимости. Например, 90% строк могут содержать значение штата «WI» для почтового кода «98052». В профиле в качестве нарушения приведены строки с правильным значением штата «WA».

  • <имя определяющего столбца>
    Отображает значение определяющего столбца или сочетания столбцов для данного случая нарушения функциональной зависимости.

  • <имя зависимого столбца>
    Отображает значение зависимого столбца для данного случая нарушения функциональной зависимости.

  • Число несущего множества
    Отображает число строк, в которых определяющий столбец определяет зависимый столбец.

  • Число нарушений
    Отображает число строк, в которых определяющий столбец не определяет зависимый столбец. (Это строки, в которых зависимым является значение, показанное в столбце <имя зависимого столбца>.)

  • Процент несущего множества
    Отображает процент строк, в которых определяющий столбец определяет зависимый столбец.

Тип профиля = Профиль включения значений

Область «Профиль включения значений»

  • Побочные столбцы подмножества
    Отображает столбец или сочетание столбцов, которые были профилированы для определения того, входят ли они в столбцы надмножества.

  • Побочные столбцы надмножества
    Отображает столбец или сочетание столбцов, которые были профилированы для определения того, включают ли они значения в столбцах подмножества.

  • Интенсивность включений
    Отображает силу (в процентах) перекрытия данных между столбцами. Стойкость ключа менее 100% означает, что в некоторых случаях значение в подмножестве не обнаружено среди значений в надмножестве.

Область «Нарушения включения»

  • <столбец1>, <столбец2> и т. д.
    Отображает значения в столбце или столбцах подмножества, не обнаруженные в столбце или столбцах надмножества.

  • Число
    Отображает число строк, в которых указанный столбец имеет значение, показанное в первом столбце.