Прочитать на английском

Поделиться через


Отчет о качестве данных в Microsoft Purview

Отчет о качестве данных (DQ) — это комплексный документ, который оценивает и суммирует качество данных в организации или системе. Обычно она включает в себя оценки различных измерений качества данных и метрики, которые помогают заинтересованным лицам понять точность, полноту, согласованность, надежность и своевременность данных. Этот отчет о качестве данных позволяет вашей команде быстро отслеживать ход управления работоспособностью и определять области, требующие дополнительной работы для повышения качества данных в вашем хранилище данных.

В этой статье описывается, как получить доступ к этому отчету и что означает предоставленная мера качества данных для управления работоспособностью.

Цели настоящего отчета о качестве данных

  • Мониторинг и управление. Для постоянного мониторинга и управления качеством данных, обеспечивая их соответствие стандартам и нормативным требованиям организации.

  • Поддержка принятия решений: предоставление заинтересованным лицам надежных данных для принятия обоснованных бизнес-решений.

  • Выявление проблем: обнаружение и документирование проблем с качеством данных, что обеспечивает своевременное исправление.

  • Улучшение Управление данными: улучшение методов управления данными путем выявления первопричин проблем с качеством данных и реализации корректирующих мер.

  • Измерение производительности: для оценки эффективности инициатив по обеспечению качества данных и отслеживания улучшений с течением времени.

  • Взаимодействие с заинтересованными лицами: информирование о состоянии качества данных и прогрессе заинтересованным лицам, включая руководство, владельцев продуктов данных, управляющих данными и ИТ-групп. Предоставляя четкое и полное представление о состоянии качества данных, эти отчеты играют решающую роль в поддержании целостности и полезности данных в организации.

Предварительные условия

  • Для просмотра сведений о работоспособности данных требуются разрешения на чтение сведений о работоспособности объектов данных.

Просмотр отчета о работоспособности системы управления данными

  1. Откройте портал Microsoft Purview и выберите Единый каталог.
  2. Выберите раскрывающийся список Управление работоспособностью .
  3. Щелкните Отчеты.
  4. Выберите отчет о работоспособности данных .

Отчеты по измерению качества данных

В этом отчете на странице обзора рассматриваются оценки измерений качества данных, иерархия правил качества данных, состояние качества данных по измерениям и измерения качества данных & типов правил, используемых для различных ресурсов данных. Основные элементы управления помогут вам быстро понять общее управление работоспособностью.

Снимок экрана: страница обзора отчета о качестве данных.

Используйте фильтры для просмотра сведений о конкретных доменах управления, продуктах данных или продуктах данных с определенным состоянием (например, черновике).

Измерение качества данных Описание
Accuracy Данные должны точно представлять реальные сущности. Контекст имеет значение! Например, если вы храните адреса клиентов, убедитесь, что они соответствуют фактическим расположениям.
Полнота Цель этого правила — идентифицировать пустые, пустые или отсутствующие данные. Это правило проверяет наличие всех значений (хотя и не обязательно правильных).
Соответствие Это правило гарантирует, что данные соответствуют стандартам форматирования данных, таким как представление дат, адресов и допустимых значений.
Последовательность Это правило проверяет, что различные значения одной записи соответствуют заданному правилу и нет никаких противоречий. Согласованность данных обеспечивает равномерное представление одной и той же информации в разных записях. Например, если у вас есть каталог продуктов, согласованные названия и описания продуктов имеют решающее значение.
Своевременность Это правило направлено на обеспечение того, чтобы данные были доступны в течение как можно более короткого времени. Это гарантирует актуальность данных.
Уникальность Это правило проверяет, не дублируются ли значения, например, если на каждого клиента должна быть только одна запись, то для одного клиента не существует нескольких записей. Каждый клиент, продукт или транзакция должен иметь уникальный идентификатор.

Общие оценки качества данных и оценки измерений помогают специалистам по обработке данных и владельцам объектов данных понять, насколько полными, точными, согласованными и надежными являются их данные. Он также указывает, какие меры по улучшению необходимо предпринять для повышения качества их хранилища данных.

Снимок экрана: оценка измерения качества данных.

Совет

Если вы используете фильтры, эти ключевые показатели эффективности будут отражать оценки для выбранных доменов управления или продуктов данных.

Состояние качества данных по измерениям

Оценки измерений качества данных вычисляются для каждой области управления. Измерения, сопоставленные с правилами, и оценка свертывается вплоть до столбцов активов данных до ресурса данных, а также от ресурса данных до продукта данных и уровня домена управления для каждого стандартного отраслевого измерения. Вы можете отфильтровать оценку на уровне измерений для каждого домена управления, чтобы изучить дополнительные сведения.

Снимок экрана: таблица

Коэффициент передачи и сбоя правил качества данных

Для каждого измерения DQ для продуктов данных измеряется коэффициент пропуска и сбоя правил качества данных. Эта мера помогает владельцам данных и специалистам по обработке данных понять, какой процент данных в продукте данных является неточным, несогласованным, неполным, повторяющимся или недостаточно свежим. Эта мера также помогает изучить и понять, являются ли примененные правила неверными или данные неверны.

Снимок экрана: правила качества данных, передаваемые и не прошедшие сбой, для каждого измерения.

Отчет о качестве данных

Этот отчет помогает понять, сколько правил применяется к продуктам данных, ресурсам данных и критически важным элементам данных для измерения и мониторинга качества всего пространства данных организации. Вы можете детализировать данные, чтобы узнать, сколько записей ресурса данных завершилось сбоем для типа правила, какой тип правила работает лучше и какие домены управления и продукты данных публикуют и поддерживают надежные данные. Вы можете отфильтровать меры по домену управления и продукту данных, чтобы понять текущее состояние и спланировать действия по улучшению.

Снимок экрана: подробный отчет о качестве данных.

Примечание

  1. Отчет о работоспособности данных имеет зависимости от элементов управления работоспособностью данных и модели самостоятельной аналитики метаданных Purview. Если клиенты не используют элементы управления работоспособностью данных и не подписываются на Purview Единый каталог метаданных, отчет о работоспособности данных обновляться не будет. Клиентам необходимо использовать элементы управления работоспособностью данных или подписаться на метаданные purview для самостоятельной аналитики, чтобы обновить отчет о работоспособности данных.
  2. Если клиенты не используют функцию "Качество данных", отчет о работоспособности качества данных будет пуст, так как отчет о работоспособности данных создается с использованием данных, создаваемых с помощью функции проверки качества данных.

Дальнейшие действия