你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
什么是适用于语言的 Azure 认知服务中的个人身份信息 (PII) 检测?
PII 检测是适用于语言的 Azure 认知服务提供的功能之一,它是云中机器学习和 AI 算法的集合,用于开发涉及书面语言的智能应用程序。 PII 检测功能可以识别、分类和编修非结构化文本中的敏感信息。 例如:电话号码、电子邮件地址和各种形式的标识信息。 在对话中使用 PII 的方法与其他用例不同,并且与此用途的文章分开。
PII 分为两种类型:
- PII - 适用于非结构化文本。
- 对话 PII(预览版) - 用于处理对话听录的定制模型。
典型工作流
若要使用此功能,需要提交数据进行分析并处理应用程序中的 API 输出。 分析按原样执行,不会对数据所用的模型进行其他自定义。
创建 Azure 语言资源,它授权你访问适用于语言的 Azure 认知服务提供的功能。 它将生成一个密码(称为密钥)和一个终结点 URL,你将使用它们来验证 API 请求。
使用 REST API 或 C#、Java、JavaScript 和 Python 的客户端库创建请求。 还可以使用批处理请求发送异步调用,以将多个功能的 API 请求合并到一个调用中。
将包含数据的请求作为原始非结构化文本发送。 密钥和终结点将用于身份验证。
在本地流式处理或存储响应。
PII 检测入门
若要使用 PII 检测,需在应用程序中提交原始非结构化文本进行分析并处理 API 输出。 分析按原样执行,不会对数据所用的模型进行自定义。 可通过两种方式使用 PII 检测:
开发选项 | 说明 |
---|---|
Language Studio | Language Studio 是一个基于 Web 的平台,让你可以在没有 Azure 帐户的情况下尝试使用文本示例进行实体链接,并在注册时使用自己的数据。 有关详细信息,请参阅 Language Studio 网站或 Language Studio 快速入门。 |
REST API 或客户端库 (Azure SDK) | 使用 REST API 或以各种语言提供的客户端库将 PII 检测集成到应用程序中。 有关详细信息,请参阅 PII 检测快速入门。 |
参考文档和代码示例
在应用程序中使用此功能时,请参阅针对适用于语言的 Azure 认知服务的以下参考文档和示例:
开发选项/语言 | 参考文档 | 示例 |
---|---|---|
REST API | REST API 文档 | |
C# | C# 文档 | C# 示例 |
Java | Java 文档 | Java 示例 |
JavaScript | JavaScript 文档 | JavaScript 示例 |
Python | Python 文档 | Python 示例 |
负责任的 AI
AI 系统不仅包括技术,还包括使用它的人员、受其影响的人员以及部署它的环境。 阅读 PII 的透明度说明,了解如何在系统中负责任地使用和部署 AI。 有关详细信息,还可以参阅以下文章:
示例方案
- 应用敏感度标签 - 例如,根据 PII 服务的结果,公共敏感度标签可能应用于未检测到 PII 实体的文档。 对于识别到美国地址和电话号码的文档,可能会应用机密标签。 高度机密标签可用于识别到银行路由号码的文档。
- 从获得更广泛的流通的文档中修订个人信息的某些类别 - 例如,如果客户联系人记录可供第一行支持代表访问,则公司可能希望从客户历史记录的版本中对除名字以外的客户个人信息进行修订,从而保留客户的隐私。
- 为了减少无意识偏见而修订个人信息 - 例如,在公司的简历审查过程中,他们可能想要隐藏姓名、地址和电话号码,以帮助减少无意识性别偏见或其他偏见。
- 替换源数据中用于机器学习的个人信息,以减少不公平性 – 例如,如果要删除在训练机器学习模型时可能会暴露性别的名称,则可以使用该服务来识别这些名称,并将它们替换为用于模型训练的泛型占位符。
- 从呼叫中心听录中删除个人信息 - 例如,如果要删除代理与客户在呼叫中心场景中出现的名称或其他 PII 数据。 可以使用该服务来标识和删除它们。
- 针对数据科学的数据清理 - PII 可用于使数据准备就绪,然后数据科学家和工程师使用这些数据来训练其机器学习模型。 对数据进行修订以确保不会泄露客户数据。
后续步骤
可以通过两种方式开始使用实体链接功能:
- Language Studio 是一个基于 Web 的平台,通过该平台,你无需编写代码即可尝试多种语言服务功能。
- 有关使用 REST API 和客户端库 SDK 向服务发出请求的说明,请参阅快速入门文章。