Поделиться через


Продукты данных в Microsoft Purview

Продукт данных — это группа ресурсов данных (таблицы, файлы, отчеты PBI и т. д.), пакетное предложение для предприятия, которое предоставляет ресурсы с вариантом использования для общего доступа к потребителям данных.

В Microsoft Purview управление данными — это не только способ обеспечить безопасность и соответствие данных, но и инструмент для ускорения бизнес-ценности данных. Каталогизация данных в вашем пространстве позволяет лучше управлять данными для правильного использования, но также предоставляет полную картину вашего ландшафта данных. Теперь, когда есть список всех доступных ресурсов данных, пользователям больше не придется полагаться на сетевые знания или знания команды, чтобы найти то, что им нужно. они могут выполнять поиск в каталоге самостоятельно. Но предоставление каждому пользователю необработанного списка всех доступных данных является подавляющим и по своей сути не полезным. Даже с хорошими описаниями, тегами и терминами глоссария может быть трудно понять, что вы ищете. А для полной визуализации данных вам, вероятно, потребуется несколько ресурсов данных, а не только один. По мере роста каталога данных контекст должен расти вместе с ним, чтобы пользователям было проще находить нужные данные и запрашивать доступ к ним.

Чтобы обеспечить масштабируемый контекст данных и управление доступом, Microsoft Purview представляет продукт данных.

Что такое продукт данных?

Продукт данных — это бизнес-концепция с именем, описанием, владельцами и, самое главное, списком связанных ресурсов данных. Продукт данных предоставляет контекст для этих ресурсов, группируя их по варианту использования для потребителей данных. Домен управления может содержать много продуктов данных, но продукт данных управляется одним доменом управления и может быть обнаружен во многих доменах.

Успешный продукт данных упрощает для потребителей данных распознавание ценных данных с помощью повседневного языка и в то же время упрощает ответственность за владение этими ресурсами данных. Давайте рассмотрим, как это выглядит.

Контекст масштабируемых данных

Например, специалист по обработке и анализу данных создает набор ресурсов данных для использования своей моделью данных и хочет, чтобы другие пользователи могли использовать тот же набор данных.

Без продуктов данных специалист по обработке и анализу данных может использовать каталог данных, добавляя термин глоссария ко всем соответствующим ресурсам данных. Пользователь может не знать, какой термин глоссария следует искать, поэтому лучше добавить описание к каждому ресурсу данных, чтобы сделать его более релевантным при поиске аналогичной информации. Но оба добавления не гарантируют, что другие пользователи будут видеть все связанные ресурсы данных. Они могут группироваться в других ресурсах, которые не так важны, или пропустить критически важный фрагмент данных и потратить время на повторение исследований, которые уже выполнил исходный специалист по обработке и анализу данных.

С помощью продукта данных специалист по обработке и анализу данных может создать продукт данных, в который перечислены все ресурсы, используемые для создания модели данных. Описание содержит полный вариант использования с примерами или рекомендациями по использованию данных. Специалист по обработке и анализу данных теперь является владельцем продукта данных, и он улучшил поиск своих потребителей данных, помогая им получить все необходимое в этом продукте данных.

Масштабируемое управление данными

Продукты данных также упрощают управление ресурсами данных. Используя тот же пример специалиста по обработке и анализу данных, который создает набор ресурсов данных:

Без продуктов данных, если пользователь хочет получить доступ к ресурсам данных для набора данных, он должен запрашивать доступ к каждому ресурсу данных по отдельности. Владелец данных может знать, что эти ресурсы используются для моделей машинного обучения, но при внесении каких-либо изменений в политики в отношении их безопасности и вариантов использования владелец данных должен перейти к каждому ресурсу по отдельности, чтобы внести эти обновления.

С помощью продуктов данных пользователь находит продукт данных, он может запросить доступ к продукту данных, который предоставит ему доступ (после утверждения) ко всем связанным ресурсам данных. Если в отношении наборов данных для машинного обучения введены дополнительные политики утверждения или использования данных, владельцу данных нужно только применить новые политики к продукту данных, и они автоматически будут передаваться в ресурсы.

Продукты данных также связаны с элементами управления работоспособностью бизнеса и OKR. Эти элементы управления позволяют владельцам данных оценивать работоспособности данных и определять приоритеты ресурсов, которым требуется внимание, а также оценивать, какие ресурсы данных обеспечивают ценность для бизнеса. Это не только поддерживает прогресс в направлении полного управления данными в вашей собственности, но и способствует развитию бизнес-ценности из ваших данных. Ресурсы больше не являются абстрактными, а связаны с реальными вариантами использования и бизнес-целями, на которых может сосредоточиться ваша команда.

Политики доступа к данным

Безопасность данных и доступ — это основной клиент успешного управления данными. Но для реализации управления данными и успешного использования данных (и, следовательно, ценности), процесс доступа к данным должен быть безопасным, удобным и настраиваемым для всех сценариев в вашем пространстве данных. Некоторые данные должны быть широко используемыми и доступными, а некоторые должны находиться под строгим утверждением и мониторингом для обеспечения правильного использования.

Каждый продукт данных имеет политику доступа, которая определяет, как пользователи запрашивают доступ, условия использования данных и кто должен утверждать доступ к данным. Каждая из этих политик доступа настраивается для соответствующего использования и будет развиваться, чтобы в будущем охватывать больше вариантов использования. Все, что нужно сделать пользователям, — это выбрать Запрос доступа внутри продукта данных, и они автоматически будут приняты в процессе, чтобы согласиться с условиями использования и получить одобрение от правильных сторон.

Дополнительные сведения о доступе к продуктам данных см. в статье об управлении политиками доступа к каталогам данных в Microsoft Purview.

Дальнейшие действия