你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

数据目录

该数据目录在一个集中位置注册和维护数据信息,并使其可供组织使用。 它可确保企业避免由不同项目团队引入冗余数据而导致的重复数据产品。

建议你预配一个数据目录服务,以定义存储在整个数据登录区域中的数据产品的元数据。

云规模分析依赖于 Microsoft Purview 来充当:

  • 注册系统
  • 企业数据源发现
  • 数据分类引擎
  • 策略存储
  • 用于注册和读取数据信息的 API
  • 合规性仪表板中心

由于数据目录是数据管理登陆区域的一部分,因此它可以通过其虚拟网络 (VNet) 对等互连和自承载集成运行时与每个数据登陆区域进行通信。 本地存储区和其他公有云中的数据产品是通过部署更多自承载集成运行时发现的。

注意

尽管本文档主要侧重于使用 Microsoft Purview 实现数据目录功能和数据分类,但企业可能已投资于其他产品,例如 Alation、Okera 或 Collibra。 如果是这种情况,请与供应商合作,尽快应用针对数据管理登陆区域描述的原则。 请注意,可能需要进行一些自定义集成。

数据发现

数据发现反映了企业拥有的所有数据的状态。 此数据称为数据资产。 在数据发现期间,会扫描和分类数据资产。 数据扫描过程会根据设置的计划直接连接到数据源。

向环境添加新的数据登陆区域时,关联的数据湖和多语言持久化源将注册为数据目录爬网程序要扫描的源。

通过自动发现数据资产来填充目录,可以:

  • 从 Azure 和本地数据源爬网元数据
  • 扫描数据湖、Blob 和其他受支持的目标
  • 从 XML、TSV、CSV、PSV、SSV、JSON、Parquet、Avro 和 ORC 文件类型的数据目标中提取架构
  • 允许通过可配置的扫描计划和扫描规则集自动更新目录

重要

将新的数据登陆区域添加到环境时,通过 Azure DevOps 将关联的数据湖和多语言存储注册为数据目录爬网程序扫描的源。

数据分类

Microsoft Purview 允许对文件、表或列资产应用系统或自定义数据分类。

数据分类类似于主题标记。 Microsoft Purview 标记和标识扫描期间在数据资产中找到的特定数据类型的内容。 可以使用敏感度标签来标识组织数据中分类类型的类别。 你还可以使用敏感度标签对你希望应用于每个类别的策略进行分组。 Microsoft Purview 使用与 Microsoft 365 相同的敏感信息类型,使你能够跨整个内容和数据资产扩展现有的安全策略和保护。

Microsoft Purview 可以扫描文档并自动进行分类。 例如,如果有一个名为 multiple.docx 的文件,并且其内容中包含国家/地区 ID 号,则 Microsoft Purview 会在资产详细信息页中添加分类,例如 EU National Identification Number

Microsoft Defender for SQL 是一个可用于 Azure SQL 数据库、Azure SQL 托管实例和 Azure Synapse Analytics 的功能。 它包括用于发现和分类敏感数据、呈现和减少潜在数据库漏洞,以及检测可能表明数据库有威胁的异常活动的功能。 Microsoft Defender for SQL 提供用于启用和管理这些功能的一个必去的位置。

后续步骤