Поделиться через


Каталог данных

Каталог данных регистрирует и хранит данные в централизованном месте и делает их доступными для организации. Это гарантирует, что предприятия избежать дублирования продуктов данных, вызванных избыточным приемом данных разными проектными группами.

Рекомендуется подготовить службу каталога данных для определения метаданных продуктов данных, хранящихся в целевых зонах данных.

Аналитика в масштабе облака использует Microsoft Purview в качестве:

  • Система регистрации
  • Обнаружение корпоративных источников данных
  • Подсистема классификации данных
  • Хранилище политик
  • API для регистрации и чтения сведений о данных
  • Центр панели мониторинга соответствия требованиям

Так как каталог данных является частью целевой зоны управления данными, он может взаимодействовать с каждой целевой зоной данных через пиринг виртуальной сети и локальные среды выполнения интеграции. Обнаружение продуктов данных в локальных хранилищах и других общедоступных облаках достигается за счет большего числа развертываний локальных сред выполнения интеграции.

Примечание

Хотя в этой документации основное внимание уделяется использованию Microsoft Purview для возможностей каталога данных и классификации данных, предприятия могли инвестировать в другие продукты, такие как Alation, Okera или Collibra. В этом случае обратитесь к поставщику, чтобы применить принципы, описанные для целевой зоны управления данными как можно ближе. Имейте в виду, что может потребоваться определенная настраиваемая интеграция.

Поиск данных

Обнаружение данных отражает состояние всех данных, которыми владеет предприятие. Эти данные называются пространством данных. Во время обнаружения данных пространство данных сканируется и классифицируется. Процесс сканирования данных подключается непосредственно к источнику данных в соответствии с заданным расписанием.

При добавлении новой целевой зоны данных в среду связанные озера данных и источники сохраняемости полиглотов регистрируются в качестве источников для сканирования обходчиками каталога данных.

С помощью автоматического обнаружения пространства данных для заполнения каталога вы можете:

  • Обход метаданных из Azure и локальных источников данных
  • Сканирование озер данных, BLOB-объектов и других поддерживаемых целевых объектов
  • Извлечение схемы из целевых объектов данных для типов файлов XML, TSV, CSV, PSV, SSV, JSON, Parquet, Avro и ORC
  • Разрешить автоматическое обновление каталога с помощью настраиваемого планирования проверок и наборов правил сканирования

Важно!

При добавлении новой целевой зоны данных в среду зарегистрируйте связанные озера данных и хранилище полиглотов в Azure DevOps в качестве источника для сканирования обходчиками каталога данных.

Классификация данных

Microsoft Purview позволяет применять системные или пользовательские классификации данных к ресурсам файлов, таблиц или столбцов.

Классификации данных похожи на теги субъектов. Microsoft Purview помечает и идентифицирует содержимое определенных типов данных, найденных в пространстве данных во время сканирования. Метки конфиденциальности используются для определения категорий типов классификации в данных организации. Вы также можете использовать метки конфиденциальности для группировки политик, которые вы хотите применить к каждой категории. Microsoft Purview использует те же типы конфиденциальной информации, что и Microsoft 365, что позволяет распределить существующие политики безопасности и средства защиты на все содержимое и пространство данных.

Microsoft Purview может сканировать и автоматически классифицировать документы. Например, если у вас есть файл с именем multiple.docx и в его содержимом есть национальный идентификатор, Microsoft Purview добавляет классификацию, например EU National Identification Number , на странице сведений об активе.

Компонент Microsoft Defender для SQL доступен для Базы данных SQL Azure, Управляемого экземпляра SQL Azure и Azure Synapse Analytics. Он включает в себя функции для обнаружения и классификации конфиденциальных данных, обнаружения и устранения потенциальных уязвимостей базы данных и обнаружения аномальных действий, которые могут указывать на угрозу для вашей базы данных. Microsoft Defender для SQL предоставляет единый центр для включения этих возможностей и управления ими.

Дальнейшие действия