你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
适用于: Azure 数据工厂
Azure Synapse Analytics
提示
试用 Microsoft Fabric 中的数据工厂,这是一种适用于企业的一站式分析解决方案。 Microsoft Fabric 涵盖从数据移动到数据科学、实时分析、商业智能和报告的所有内容。 了解如何免费开始新的试用!
本文介绍一个解决方案模板,该模板可用于通过 Azure AI 服务检测数据流中的 PII 数据并对其进行掩码。
关于此解决方案模板
此模板从 Azure Data Lake Storage Gen2 源检索数据集。 然后会使用派生列创建请求正文,并且在将数据加载到目标接收器之前,一个外部调用转换将调用 Azure AI 服务并对 PII 数据进行掩码。
该模板包含一个活动:
- “数据流”,用于检测 PII 数据并对其进行掩码
此模板定义 3 个参数:
- sourceFileSystem 是从中读取源存储内的文件的文件夹路径。 需将默认值替换为自己的文件夹路径。
- sourceFilePath 是从中读取源存储内的文件的子文件夹路径。 需将默认值替换为自己的子文件夹路径。
- sourceFileName 是要转换的文件的名称。 需将默认值替换为自己的文件名。
先决条件
- Azure AI 服务资源终结点 URL 和密钥(从此处创建新资源)
如何使用此解决方案模板
通过滚动模板库或模板筛选器,转到模板“PII 检测和掩码”。
使用下拉菜单“新建”与源存储的连接,或选择现有连接。 源存储是要从中读取文件的存储。
单击“新建”将需要创建新的链接服务连接。
使用下拉菜单“新建”与 Azure AI 服务资源的连接,或选择现有连接。 需要终结点 URL 和资源密钥才能创建此连接。
单击“新建”将需要创建新的链接服务连接。 请确保在 Auth 标头“Ocp-Apim-Subscription-Key”下输入资源的终结点 URL 和资源密钥。
选择“使用此模板”以创建管道。
你应该会看到以下管道:
单击数据流活动将显示以下数据流:
启用“数据流调试”。
更新“调试设置”中的参数,并单击“保存”。
在“数据预览”中预览结果。
当数据预览结果符合预期时,请更新“参数”。
返回到管道,然后选择“调试”。 查看结果并发布。