可训练分类器定义

Microsoft Purview 附带多个预先训练的分类器。 它们显示在状态为 Ready to useMicrosoft Purview 合规门户>Data 分类>可训练分类器视图中。

重要

请注意,内置的可训练和全局分类器不提供这些领域的术语或语言的详尽或完整列表。 此外,语言和文化标准不断变化,鉴于这些现实,Microsoft 保留自行决定更新这些分类器的权利。 虽然分类器可以帮助组织检测这些区域,但分类器并非旨在提供组织检测或处理此类语言使用的唯一方法。 你的组织(而不是 Microsoft 或其子公司)仍负责与监视、扫描、阻止、删除和保留预先训练的分类器标识的任何内容相关的所有决策,包括遵守本地隐私和其他适用法律。 Microsoft 鼓励在部署和使用之前咨询法律顾问。

提示

如果你不是 E5 客户,请使用为期 90 天的 Microsoft Purview 解决方案试用版来探索其他 Purview 功能如何帮助组织管理数据安全性和合规性需求。 立即从Microsoft Purview 合规门户试用中心开始。 了解有关 注册和试用条款的详细信息。

成人、猥亵和血腥图像

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测可能不适当的图像。 Exchange Online电子邮件以及 Microsoft Teams 频道和聊天支持扫描和检测。 检测.jpeg、.png、.gif 和 .bmp 文件中的内容。 不适用 不适用

注意

图像的大小必须介于 100 kb (KB) 和 4 MB (MB) 之间,高度 x 宽度尺寸必须大于 50 x 50 像素。

协议

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测与法律协议相关的内容,例如保密协议、工作声明、贷款和租赁协议、雇佣和非公司协议。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf、.txt、.one、.msg.eml文件中的内容。 英语

银行对帐单

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测包含银行帐户财务交易的项目,包括给定时间段内的帐户信息、存款、取款、帐户余额、应计利息和银行费用。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf .txt 文件中的内容。 英语

预算

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测预算文档、预算预测和当前预算报表,包括组织的收入和支出。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf 中的内容 .txt、.one、.eml、.pptx、.pptm、.ppt、.potx、.potm、.pot、.ppsx、.ppsm、.pps、.ppam、.ppa、.xlsx、.xlsm、.xlsb、.xls、.csv、.xltx、.xltm、.xlt、.xlt、.xlam、.xla 文件。 英语

业务上下文

(预览)

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测是否存在与业务相关的内容,例如组织结构、策略更新、合同、人力资源策略、关键财务数据(如收入和利润)、医疗保健表单、员工合同等 检测 docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf、.txt、.one、.pptx、.pptm、.ppt、.potx、.potm、.potx、.ppsx、.ppsm、.pps、.ppam、.ppa .txt 文件中的内容。 英语 N.A.

业务计划

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测业务计划的组成部分,包括商业机会、实现结果计划、市场研究和竞争对手分析。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf、.txt、.one、.eml、.pptx、.pptm、.ppt、.potx、.potm、.potm、.potx、.ppsm、.pps、.ppam、.ppa 文件。 英语

完成证书

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测项目经理或承包商在项目或工作结束时颁发的官方文档。 本文档用于证明特定项目的工作已根据合同或协议完成。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf .txt 文件中的内容。 英语

构造规范

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测工厂、工厂、商业办公室、机场、道路等商业和工业项目的施工规范。 捕获有关质量、数量、建筑材料类型、工艺等的准则。检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf、.txt、.one、.msg、.eml、.pptx、.pptm、.ppt、.potx、.potm、.pot、.ppsx、.ppsm、.pps、.ppam、.ppa 文件。 英语

公司破坏

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测可能提及损害或销毁公司资产或财产的行为的消息。 此分类器可帮助客户管理法规合规性义务,例如 NERC 关键基础结构保护标准或州法规(如华盛顿州第 9.05 章 RCW)。 检测.msg、.docx、.pdf、.txt、.rtf、.jpeg、.jpg、.png、.gif、.bmp.svg文件中的内容。 英语

重要

此分类器可能会捕获大量批量发件人/新闻稿内容。 在“通信合规性”中,可以通过在创建策略时选择“筛选电子邮件爆炸检查”框来缓解对大量批量发件人/新闻稿内容的检测。 还可以编辑现有通信合规性策略以启用此功能。

客户投诉

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
客户投诉分类器可检测有关组织的产品或服务的反馈和投诉。 此分类器可帮助你满足投诉检测和会审的监管要求,如消费者金融保护局和食品药品监督管理局的要求。 对于通信合规性,它会检测.msg和.eml文件中的内容。 对于Microsoft Purview 信息保护服务的其余部分,它会检测 .docx、.pdf、.txt、.rtf、.jpg、.jpeg、.png、.gif、.bmp.svg文件中的内容。 英语

歧视

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
与其他社区相比,检测明确的歧视性语言,并敏感对待针对非裔美国人/黑人社区的歧视性语言。 这适用于通信合规性,它是基于文本的分类器。 英语

员工纪律处分

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测与纪律处分相关的文件,包括针对员工不当行为、违反规则或表现不佳的谴责或纠正措施。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf、.txt、.one、.msg.eml文件中的内容。 英语

员工保险

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测与员工医疗保险和工作场所残疾保险相关的文档。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf、.txt、.one、.msg、.eml、.pptx、.pptm、.ppt、.potx、.potm、.pot、.ppsx、.ppsm、.pps、.ppam、.ppa 文件。 英语

雇佣协议

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测包含开始日期、工资、薪酬、就业职责等详细信息的雇佣协议。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf .txt 文件中的内容。 英语

员工养老金记录

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测与员工养老金记录相关的文档,例如索赔表、申报表、计划和福利单。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf、.txt、.one、.pptx、.pptm、.ppt、.potx、.potm、.potx、.ppsx、.ppsm、.pps、.ppam、.ppa、.txt、.one、.msg、.eml 文件中的内容。 英语

员工股票和金融债券记录

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测组织授予员工的相关股票和金融债券的文档。 此分类器标识属于员工工资表的员工股票和金融债券详细信息。 包含债券条款、分配、权益等详细信息。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf、.txt、.one、.pptx、.pptm、.ppt、.potx、.potm、.potx、.ppsx、.ppsm、.pps、.ppam、.ppa、.txt、.one、.msg、.eml 文件中的内容。 英语

企业风险管理

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
企业风险管理包括财务风险、战略风险、运营风险以及与意外损失相关的风险。 此类别包括组织用来管理风险和抓住与实现目标相关的机会的方法。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf .txt 文件中的内容。 英语

财务

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测企业财务、会计、经济、银行和投资类别中的内容。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf、.txt 中的内容 .one、.msg、.eml、.pptx、.pptm、.ppt、.potx、.potm、.pot、.ppsx、.ppsm、.pps、.ppam、.ppa、.xlsx、.xlsm、.xlsb、.xls、.csv、.xltx、.xltm、.xlt、.xlt、.xlam、.xla 文件。 英语

财务审计

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测与组织进行的外部或内部审核相关的财务审计的文件、文档和报告。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf、.txt、.one、.msg.eml文件中的内容。 英语

财务报表

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测财务报表,如损益表、资产负债表、现金流量表、权益变化表。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf、.txt、.xlsx、.xlsm、.xlsb、.xls、.csv、.xltx、.xltm、.xlt、.xlam、.xla 文件中的内容。 英语

货运单证

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测授权从源导出或导入特定数量的货物的文档。 此模型对不同文档进行分类,包括提单、产地证书、商业发票、出口进口报关单、进口商安全申报 (ISF) 。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf、.txt、.one、.pptx、.pptm、.ppt、.potx、.potm、.potm、.pot、.ppsx、.ppsm、.pps、.ppam、.ppa、.txt、.one 文件中的内容。 英语

礼品 & 娱乐

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测可能建议交换礼品或娱乐以换取服务的信息,这违反了与贿赂相关的法规。 此分类器可帮助客户管理法规遵从性义务,例如《外国腐败行为法》 (FCPA) 、英国贿赂法和 FINRA 规则 2320。 检测.msg、.docx、.pdf、.txt、.rtf、.jpeg、.jpg、.png、.gif、.bmp.svg文件中的内容。 英语

重要

此分类器可能会捕获大量批量发件人/新闻稿内容。 在“通信合规性”中,可以通过在创建策略时选择“筛选电子邮件爆炸检查”框来缓解对大量批量发件人/新闻稿内容的检测。 还可以编辑现有通信合规性策略以启用此功能。

骚扰

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
根据以下特征检测与攻击性行为相关的攻击性行为的特定类别:种族、种族、宗教、国籍、性别、性取向、年龄、残疾。 检测.msg、.docx、.pdf、.txt、.rtf、.jpeg、.jpg、.png、.gif、.bmp.svg文件中的内容。 -阿拉伯语
- 简体中文 ()
- 中 (繁体)
-荷兰语
-英语
-法语
-德语
-意大利语
-朝鲜语
-日语
-葡萄牙语
-西班牙语
是 (英语)

健康/医疗表单

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测各种表单和文件,这些表单和文件用于系统记录患者的入院详细信息、病历、患者信息和先前授权请求,通常用于医疗/卫生服务。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf、.txt、.one、.msg、.eml、.pptx、.pptm、.ppt、.potx、.potm、.pot、.ppsx、.ppsm、.pps、.ppam、.ppa 文件。 英语

医疗

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测医疗和医疗保健管理方面的内容,例如医疗服务、诊断、治疗、索赔等。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf、.txt 中的内容 .one、.msg、.eml、.pptx、.pptm、.ppt、.potx、.potm、.pot、.ppsx、.ppsm、.pps、.ppam、.ppa、.xlsx、.xlsm、.xlsb、.xls、.csv、.xltx、.xltm、.xlt、.xlt、.xlam、.xla 文件。 英语

人力资源

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测人力资源相关类别中的内容,包括招聘、面试、招聘、培训、评估、警告和解雇。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf、.txt 中的内容 .one、.msg、.eml、.pptx、.pptm、.ppt、.potx、.potm、.pot、.ppsx、.ppsm、.pps、.ppam、.ppa、.xlsx、.xlsm、.xlsb、.xls、.csv、.xltx、.xltm、.xlt、.xlt、.xlam、.xla 文件。 英语

发票

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测包含购买明细摘要、所欠总余额、当前应付付款和各种付款方式的发票。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf、.txt、.one、.eml、.xlsx、.xlsm、.xlsb、.xls、.csv、.xltx、.xltm、.xltm、.xlt、.xlam、.xla 文件中的内容。 英语

知识产权

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测知识产权相关类别中的内容,例如商业机密和类似的机密信息。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf、.txt 中的内容 .one、.msg、.eml、.pptx、.pptm、.ppt、.potx、.potm、.pot、.ppsx、.ppsm、.pps、.ppam、.ppa、.xlsx、.xlsm、.xlsb、.xls、.csv、.xltx、.xltm、.xlt、.xlt、.xlam、.xla 文件。 英语

信息技术

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测信息技术和网络安全类别(例如网络设置、信息安全、硬件和软件)中的内容。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf、.txt 中的内容 .one、.msg、.eml、.pptx、.pptm、.ppt、.potx、.potm、.pot、.ppsx、.ppsm、.pps、.ppam、.ppa、.xlsx、.xlsm、.xlsb、.xls、.csv、.xltx、.xltm、.xlt、.xlt、.xlam、.xla 文件。 英语
说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测法律事务相关类别中的内容,例如诉讼、法律程序、法律义务、法律术语、法律和立法。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf、.txt、.one、.msg.eml文件中的内容。 英语
说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测各种具有法律约束力的文件/合同/协议,例如仲裁协议、委托书、双方之间的购买协议。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf .txt 文件中的内容。 英语

许可协议

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测许可协议,包含许可方使用和补偿的条款和条件。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf .txt 文件中的内容。 英语

贷款协议和报价书

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测文档中包含的贷款协议、报价书和条款和条件。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf、.txt、.one、.msg.eml文件中的内容。 英语

制造批记录

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测包含整个制造过程的详细信息和产品批次历史记录的制造批处理文档。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf、.txt、.one、.msg.eml文件中的内容。 英语

合并和收购文件

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测文档,包括意向书、术语表和相关文件。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf、.txt、.one、.msg.eml文件中的内容。 英语

会议记录

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测包含特定于会议的信息的文档和笔记。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf、.txt、.one、.msg、.eml、.pptx、.pptm、.ppt、.potx、.potm、.pot、.ppsx、.ppsm、.pps、.ppam、.ppa 文件。 英语

洗钱

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
发现可能暗示洗钱或从事隐瞒或伪装收益来源或目的地的行为的迹象。 此分类器可帮助客户管理监管合规义务,例如《银行保密法》、《美国爱国者法案》、FINRA 规则 3310 和 2020 年《洗钱法案》。 检测.msg、.docx、.pdf、.txt、.rtf、.jpeg、.jpg、.png、.gif、.bmp.svg文件中的内容。 英语

重要

此分类器可能会捕获大量批量发件人/新闻稿内容。 在“通信合规性”中,可以通过在创建策略时选择“筛选电子邮件爆炸检查”框来缓解对大量批量发件人/新闻稿内容的检测。 还可以编辑现有通信合规性策略以启用此功能。

网络设计文件

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测有关计算机网络的技术文档,包括网络的各个组件、连接方式、体系结构、性能以及故障排除位置。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf、.txt、.one、.msg、.eml、.pptx、.pptm、.ppt、.potx、.potm、.pot、.ppsx、.ppsm、.pps、.ppam、.ppa 文件。 英语

保密协议

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测保密协议 (NDAs) 。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf .txt 文件中的内容。 英语

Paystub

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测工资单/工资对帐单文件。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf、.txt、.xlsx、.xlsm、.xlsb、.xls、.csv、.xltx、.xltm、.xlt、.xlam、.xla 文件中的内容。 英语

个人财务信息

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测与不同个人财务记录相关的文档,包括财务报表、房地产规划和退休计划。 包含个人持有的所有资产和负债的详细信息。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf、.txt、.one、.txt.one 文件中的内容。 英语

采购

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测投标、报价、购买和支付商品和服务供应类别的内容。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf、.txt、.one、.msg、.eml、.xlsx、.xlsm、.xlsb、.xls、.csv、.xltx、.xltm、.xlt、.xlam、.xla 文件中的内容。 英语

项目文档

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测项目报告和文档,包括项目规划文档、项目章程文档和计划。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf、.txt、.one、.msg、.eml、.pptx、.pptm、.ppt、.potx、.potm、.pot、.ppsx、.ppsm、.pps、.ppam、.ppa 文件。 英语

脏话

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测特定类别的冒犯性语言文本项,其中包含使大多数人感到尴尬的表达式。 检测.msg、.docx、.pdf、.txt、.rtf、.jpeg、.jpg、.png、.gif、.bmp.svg文件中的内容。 -阿拉伯语
- 简体中文 ()
- 中 (繁体)
-荷兰语
-英语
-法语
-德语
-意大利语
-朝鲜语
-日语
-葡萄牙语
-西班牙语
是 (英语)

报价

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
根据特定条件检测提供以设定价格销售商品或服务的文档。 它包含对商品或服务、货物价格或服务费率、数量和总成本的说明。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf、.txt、.one、.eml、.xlsx、.xlsm、.xlsb、.xls、.csv、.xltx、.xltm、.xltm、.xlt、.xlam、.xla 文件中的内容。 英语

监管串通

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测可能违反法规反串通要求的消息,例如试图隐瞒敏感信息。 此分类器可帮助客户管理监管合规义务,例如《谢尔曼反垄断法》、1933年《证券交易法》、1934年《证券交易法》、1940年《投资顾问法》、《联邦委员会法》和《Robinson-Patman 法》。 检测.msg、.docx、.pdf、.txt、.rtf、.jpeg、.jpg、.png、.gif、.bmp.svg文件中的内容。 英语

重要

此分类器可能会捕获大量批量发件人/新闻稿内容。 在“通信合规性”中,可以通过在创建策略时选择“筛选电子邮件爆炸检查”框来缓解对大量批量发件人/新闻稿内容的检测。 还可以编辑现有通信合规性策略以启用此功能。

Resume

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测应聘者向雇主提供的简历文件,其中详细说明了应聘者以前的工作经验、教育和成就。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf .txt 文件中的内容。 英语

安全记录

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测与设施/工厂安全相关的文档。 这些文件可以是设施安全计划、安全评估和审核报告、应急响应和疏散计划,以及有关安全测量的设备检查报告。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf、.txt、.one、.pptx、.pptm、.ppt、.potx、.potm、.potm、.potm、.ppsm、.pps、.ppam、.ppa、.txt、.one .eml文件中的内容。 英语

销售和收入

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测组织的销售报告、收入/利润表和销售/需求预测报告。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf、.txt、.one、.pptx、.pptm、.ppt、.potx、.potm、.potm、.potsx、.ppsx、.pps、.ppam、.ppa 文件中的内容。 英语

软件产品开发文件

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测软件开发中使用的文件,包括产品要求文档、产品测试和规划、文件(包括测试用例)和测试报告。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf、.txt、.one、.msg.eml文件中的内容。 英语

源代码

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测包含 GitHub 上计算机编程语言编写的一组指令和语句的项:ActionScript、C、C#、C++、Clojure、CoffeeScript、Go、Haskell、Java、JavaScript、Lua、MATLAB、Objective-C、Perl、PHP、Python、R、Ruby、Scala、Shell、Swift、TeX、Vim Script。 检测 .c、.h、.w、.cs、.cake、.csx、.cpp、.c++、.cc、.cp、.cxx、.hh、.hpp、.hxx、 .java、.js、.m、.matlab、.pl、.perl、.pm、.prl、.ipb、.php、.php3、.php4、.php5、.py、.pyc、.pyo、.r、.rl、.rb、.irb、.swift、.as、.clj、.cljs、.cljc、.coffee。Go、.hs、.hsc、.lua、.lub、.m、.mm、.scala、.sca、。Tex、T、.xs、。 sh、.vim、.edn、.javac、.lhs、.mjs、.pod、.r、.rda、。RData、.rds、.rb、.bash、.docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf、.txt、.one、.eml、.msg .pptx、.pptm、.ppt、.potx、.potm、.potx、.potx、.ppsm、.pps、.ppam、.ppa、.xlsx、.xlsm、.xlsb、.xls、.csv、.xltx、.xlt、.xlam、.xla、.sc、.litcoffee 文件。 不适用

注意

源代码经过训练,以检测大部分文本是否为源代码。 它不会检测穿插纯文本的源代码文本。

标准操作过程和手册

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测为帮助工作人员执行日常操作或制造任务而创建的文档说明集。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf .txt 文件中的内容。 英语

帐目表

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
对帐单是帐户内容的详细报告。 此分类器标识与对账单、应付帐款和应收账款相关的文档。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf、.txt、.xlsx、.xlsm、.xlsb、.xls、.csv、.xltx、.xltm、.xlt、.xlam、.xla 文件中的内容。 英语

工作声明

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测工作声明 (SOW) ,其中包含双方的要求、职责、条款和条件等详细信息。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf .txt 文件中的内容。 英语

股票操作

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测可能操纵股票的迹象,例如建议购买、出售或持有可能暗示试图操纵股价的股票。 此分类器可帮助客户管理法规遵从性义务,例如 1934 年《证券交易法》、FINRA 规则 2372 和 FINRA 规则 5270。 检测.msg、.docx、.pdf、.txt、.rtf、.jpeg、.jpg、.png、.gif、.bmp.svg文件中的内容。 英语

重要

此分类器可能会捕获大量批量发件人/新闻稿内容。 在“通信合规性”中,可以通过在创建策略时选择“筛选电子邮件爆炸检查”框来缓解对大量批量发件人/新闻稿内容的检测。 还可以编辑现有通信合规性策略以启用此功能。

税务文档

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测与税务相关的内容,例如税务规划、税单、税务申报、税务法规。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf、.txt 中的内容, .one、.msg、.eml、.pptx、.pptm、.ppt、.potx、.potm、.pot、.ppsx、.ppsm、.pps、.ppam、.ppa、.xlsx、.xlsm、.xlsb、.xls、.csv、.xltx、.xltm、.xlt、.xlt、.xla 文件。 英语

威胁

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测与威胁实施暴力或对人或财产造成人身伤害或损害相关的特定类别的冒犯性语言文本项目。 检测.msg、.docx、.pdf、.txt、.rtf、.jpeg、.jpg、.png、.gif、.bmp.svg文件中的内容。 -阿拉伯语
- 简体中文 ()
- 中 (繁体)
-荷兰语
-英语
-法语
-德语
-意大利语
-朝鲜语
-日语
-葡萄牙语
-西班牙语
是 (英语)

未经授权的披露

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
检测包含明确指定为机密或未经授权的个人内部内容的信息共享。 此分类器可帮助客户管理法规合规性义务,例如 FINRA 规则 2010 和 SEC 规则 10b-5。 检测.msg、.docx、.pdf、.txt、.rtf、.jpeg、.jpg、.png、.gif、.bmp.svg文件中的内容。 英语

重要

此分类器可能会捕获大量批量发件人/新闻稿内容。 在“通信合规性”中,可以通过在创建策略时选择“筛选电子邮件爆炸检查”框来缓解对大量批量发件人/新闻稿内容的检测。 还可以编辑现有通信合规性策略以启用此功能。

电汇

说明 文件类型 语言 上下文摘要和关键字突出显示 总结
电汇是一种电子资金从一个人或实体转移到另一个实体的方法。 该模型捕获所有电汇收据和确认。 检测 .docx、.docm、.doc、.dotx、.dotm、.dot、.pdf、.rtf .txt 文件中的内容。 英语

Word计数要求

某些分类器对邮件有最低字数计数要求。 若要识别包含不符合下表中列出的字数计数要求的不当语言内容的邮件并采取措施,可以创建自定义关键字 (keyword) 字典,用于检测此类内容的通信合规性策略。

分类器 最小字数 语言
威胁、骚扰和亵渎 六个字 -荷兰语
-法语
-德语
-意大利语
-日语
-葡萄牙语
-西班牙语
威胁、骚扰和亵渎 12 个字 -阿拉伯语
-简体中文
-繁体中文
-朝鲜语
威胁和骚扰 三个字 英语
脏话 五个字 英语
公司破坏
- 客户投诉
- 礼品 & 娱乐
-洗钱
- 监管串通
- 股票操作
- 未经授权的披露
六个字 英语

另请参阅