设置丢失防护
Microsoft Dynamics 365 欺诈防护中的损失防护功能使用自适应人工智能(AI)来生成风险评分,并识别历史事务数据中的数据异常和模式。 然后,可以使用这些风险分数、异常和模式来生成报告,这些报告根据返回率、折扣率和其他可能指示店内欺诈的关键绩效指标(KPI)提供详细的趋势分析。
识别欺诈活动
损失预防功能旨在帮助损失预防分析师、商店经理和损失预防调查人员识别通常涉及折扣、退货、价格替代、无效交易、礼品卡兑换等欺诈活动,员工在销售点(POS)终端上不当应用。
损失防护基于异常情况检测,用于查找引入到系统中的 POS 数据中的模式。 它通过无监督机器学习(ML)标识离群值,并提供异常终端、异常执行组件和异常产品的列表。 商店经理、损失防护分析师和损失防护欺诈调查人员随后可以使用此列表专注于可能代表欺诈的特定领域。
损失防护有助于降低成本与处理大量数据、分析欺诈模式以及从中获取可操作见解的过程相关的成本和复杂性。 因此,可以快速确定风险领域,例如商店、终端、班次和/或可能误用退货和折扣策略的员工。
本文档的目标
本文档的目的是指导你完成以下活动:
- 步骤 1:准备历史数据。 此活动也称为 数据映射。
- 步骤 2:上传数据并生成丢失防护报告。
- 步骤 3:分析丢失防护报告中的数据。
使用自己的数据在自己的系统中完成这些步骤后,你将拥有一个可操作的丢失防护报告。 你还将能够定期运行损失防护报告。
先决条件
在开始本文档中的任务之前,必须:
- 在 Microsoft Entra 租户中设置欺诈保护,如设置试用实例中所述。
步骤 1:准备历史数据(数据映射)
当欺诈保护评估潜在购买欺诈交易时,它将使用 AI、ML 和数据联盟的组合。 大量数据为用于评估的模型提供支持。 传输到系统进行评估或系统学习的任何数据都必须符合预定义的架构。 在 AI 和 ML 世界中,通常理解模型使用的数据质量会影响结果的质量。
数据映射 是一个过程,可帮助确保将正确的值分配给正确的架构字段,并且你的商业系统与欺诈保护正确集成。 有关架构的详细信息,请参阅 用于防止丢失的数据架构。
数据上传的架构指南
- 这些文件采用 CSV UTF-8(逗号、分号或制表符分隔)格式(*.csv或 *.tsv)。
- 最大文件大小为 10 GB(GB)。
- 以下字符在所有列中进行转义:逗号/分号、新行字符和多行字符。
- “datetime”列采用 ISO 8601 格式。 例如,在 C# DateTime.UtcNow.ToString(“o”)中,格式为“2019-03-14T20:18:11.254Z”。
- “double”(十进制)列精度为两个小数位数。
有关可用于生成模型并确定风险评估的架构的详细信息,请参阅 数据架构来防止丢失。
数据映射所需的数据实体
由于损失防护功能可识别可能指示店内欺诈的异常和模式,因此 ML 模型需要来自四个实体的数据来搜索异常:
- 交易
- 销售
- 付款
- PaymentMethods
有关定义用于生成模型并确定风险评估的数据的架构的详细信息,请参阅 用于防止丢失的数据架构。 虽然所有数据字段都很重要,但你可以从更少的必填字段开始,然后随着时间的推移载入其他字段来改进模型输出。
重要
用于分析丢失的数据很敏感,应注意仅从安全网络位置上传它。 请注意,Microsoft 仅请求有关付款方式的部分数据(银行标识号 [BIN] 和最后四位数字)。 我们不会请求完整的付款方式号或社会保障号码(SSN)。 因此,不要在上传的文件中包括这种类型的数据。 有关如何在欺诈保护中使用和保护数据的详细信息,请参阅 安全、合规性和数据主体请求。
如果无法映射所有数据,该怎么办
欺诈保护使用一组广泛的数据实体,有时数据可能缺失,或者无法将其干净映射到字段。 Microsoft 发现以下因素可能导致数据质量问题:
- 属性不可用。
- 属性可用,但它们未设置或未正确设置。
- 架构被错误地解释。
- 数据不正确,/或枚举值不正确。
- 同一属性不匹配。
- 存在数据加密问题。
Microsoft 鼓励你尽量映射尽可能多的数据字段。 但是,如果某些字段无法映射,请记住以下几点:
- 可以根据需要重复数据上传,以改进系统有权访问的信息。
- 若要成功生成报表以用于分析目的,必须至少有 一个月的 事务数据。
连接、断开连接并重新连接到欺诈保护
有两种方法可将历史数据上传到欺诈保护,以防止丢失:
- 使用 D365 连接or 连接到 Dynamics 365 Commerce 系统并直接上传数据。
- 上传 CSV 格式的数据文件。
选择适合你的情况的数据连接方法。
若要将丢失防护连接到 Commerce,必须完成一系列一次性设置活动。 完成这些活动后,可以轻松断开连接并重新连接系统。 有关详细信息,请参阅连接来自 Commerce 的数据丢失防护。
若要将零售数据连接到欺诈保护,请确保满足以下三项先决条件:
- 访问零售数据湖。
- 访问财务和运营环境。
- 欺诈保护许可证(试用或激活的订阅)。
连接商业数据丢失防护
- 在 Commerce 中,打开仪表板,并在页面顶部的搜索字段中输入系统参数。
- 在 “系统参数 ”页上,选择“ 数据连接 ”选项卡。
- 将 “启用 Data Lake 集成 ”选项设置为 “是”。
- 保存 Data Lake 的详细信息(DNS 名称字段的值)。 如果 Data Lake 集成已断开连接,则需要此信息重新连接。
返回到仪表板,并在页面顶部的搜索字段中输入实体存储。
(实体存储是具有原始或聚合形式的零售数据的表/视图的集合。
在实体存储区中,在搜索字段中输入 RetailSales 。
在“刷新”选项下,将“启用自动刷新”选项设置为“是”。
自动刷新以增量方式将 POS 设备的最新数据添加到零售数据湖。
返回到仪表板并选择“功能管理”磁贴。
在 功能管理 工作区中,找到 Dynamics 365 欺诈防护(DFP)丢失防护 功能,并启用该功能。
在仪表板中注册欺诈保护应用 ID:
打开 Microsoft Entra 应用程序页。
为欺诈保护的第一方应用 ID 创建条目。 (例如, bf04bdab-e06f44f3-9821-d3af64fc93a9.)
在 “用户 ID ”字段中,选择 RetailServiceAccount。
此设置授权欺诈保护从 Data Lake 访问数据。
打开欺诈保护门户,使用商业环境的 URL 将财务和运营环境连接到欺诈保护环境。
在以下屏幕截图中,连接成功,同步以从 Commerce 获取数据并生成丢失防护报告的过程已开始。
断开与商务的连接并重新连接到商务
在商业和欺诈保护之间建立初始连接后,可以轻松断开连接和重新连接。
断开与商务的连接
选择 Dynamics 365 Commerce 连接窗格右上角的三个点,然后选择“断开连接”。
选择继续以断开连接。
最初连接到此欺诈保护丢失防护功能的数据湖已断开连接。
重新连接到商务
- 选择数据连接。
- 输入在初始设置期间为商务环境(data lake)创建的详细信息。 (请参阅 步骤 4连接本文档前面的“商务”部分中的数据丢失防护。
- 选择“连接” 。
连接成功后,同步以获取数据并立即更新报表的过程会再次启动。
步骤 2:上传数据并生成丢失防护报告
登录到欺诈保护门户时,如果 丢失防护 显示在左侧导航窗格中,则会启用损失防护功能。
在左侧导航中,选择“丢失防护”,然后选择“转到数据上传”。
选择“丢失防护”选项卡,然后选择“丢失防护”按钮。
损失防护功能特别侧重于分析与回报和折扣相关的损失。 它需要销售终端的四种类型的数据集:
- 交易
- 销售
- 付款
- 付款方式
注意
数据必须位于 .CVS 格式,并且必须遵循数据架构中 提供的架构来防止丢失。
上传数据文件:
在左侧导航中,选择“数据”,选择“数据上传”,然后选择“丢失防护”。
选择 “选择数据源”,选择要上传的文件类型(.csv或 .tst 文件),然后选择“ 浏览”。
选择要上传的文件,选择“打开”,然后选择“下一步”。
“数据上传>付款”页显示数据的预览。
在顶部导航中,选择“ 保存并关闭”。
重复步骤 2 到 4 以上传所有四种类型的数据。
上传所有数据文件后,选择“ 进程丢失防护数据”。
欺诈防护开始处理数据并生成丢失防护报告。
在左侧导航中,选择“丢失防护”以查看丢失防护报告的状态。
注意
通常,损失防护大约需要 30 到 60 分钟才能生成报表包。 但是,实际时间长度取决于提供的数据量。
报表显示在 “丢失防护”页中。 若要下载副本,请选择“ 下载报表”。
步骤 3:分析丢失防护报告中的数据
当欺诈保护具有数据源时,可以根据需要生成损失防护报告。 根据你配置环境的方式,可以从与商务系统的直接连接或上传的数据文件生成报表。
在上一步中,你运行了第一个损失防护报告。 在此步骤中,你将使用报表上的发现来识别返回和折扣异常,然后在新数据可用时运行其他损失防护报告。
可以在“丢失防护”页上显示的报告中查看以下信息。
基于员工数据的收入机会
在以下屏幕截图中,可以根据风险分数 560 及更高版本查看信息。
可以设置要在“月范围”字段中分析数据的 月份范围 。 可以在“风险评分范围”字段中设置风险分数范围。
- 若要查看风险分数分布的完整范围,请将“from”值设置为 0(零),将“to”值设置为 999。
- 若要深入了解可能的欺诈活动,请将分数范围保持在较高水平。
在 “风险分数范围 ”字段中,可以设置风险分数范围。
- 若要深入了解可能的欺诈活动,请调整风险分数范围字段的值,以便它们仅跨越高分范围,例如 900 到 999。
基于员工数据窗格的收入机会汇总了欺诈保护在回报和折扣中检测到的潜在欺诈总额,这可能导致整体收入收益。
按 月份计算的异常员工计数和分数箱 图表显示在页面顶部的 “月范围 ”字段中选择的月份范围内每月的异常员工和终端计数分布。
基于终端数据的收入机会
在以下屏幕截图中,可以根据风险分数 760 及更高版本查看信息。
基于终端数据窗格的“收入”机会提供退货、折扣和总计的摘要。
异常 终端按月计数,分数箱 显示可能且不太可能欺诈的终端的每月计数。
如果想要更好地了解特定终端的工作原理,一个有用的工具是趋势分析,将特定终端的分数与整个总体的分数进行比较。
将鼠标悬停在图表中的特定数据点上时,将显示终端的风险评分和整个总体的平均风险分数。 在以下示例中,锯齿模式是此终端在异常行为方面来回移动的事实的良好表示形式。
该模型使用五到六个默认事件生成风险分数。 它考虑返回比率,即员工在特定终端发起的回报总数,除以给定期间该终端的销售总额。 它还考虑了现金到卡比率以及使用多个付款卡的员工折扣购买数量。 最后,它考虑没有收据的回报与收据的回报比率,以及未折扣销售的折扣项目的数量。
风险最高的员工
- 若要查看风险最高的员工的数据,请选择“ 员工 ”选项卡。
以下屏幕截图显示了包含至少一个月的阈值为 560 的员工的信息。 数据集根据模型生成的风险分数对数据集进行排序,以显示员工。
“ 数据摘要 ”部分提供员工评估摘要。 它显示唯一员工 ID 总数、分数计数(报告数据期间唯一工作人员异常的次数),以及平均风险分数(从 0(零)到 999。
- 若要搜索与特定员工成员相关的数据,请在搜索字段中输入员工 ID。
“最高风险员工”网格列出了模型分析的所有员工 ID。 该列表按风险分数的降序排序(即最高风险员工显示在列表顶部)。 该网格还显示每个工作人员的平均分数,以及每个工作人员在报告评估的完整数据期间被视为异常的次数。
分数 计数 表示超出阈值的月份数。 例如,如果使用 12 个月的数据来生成报告,则工作人员的分数计数值为 3 表示该工作人员在 12 个月内被视为异常的 3。
- 若要查看有关特定员工成员的更多详细信息,请在“员工 ID”列中选择一个 ID。
员工的风险分数摘要
- 若要查看特定员工的风险评分,请选择 员工 ID。
以下屏幕截图显示了包含至少一个月的阈值为 560 的员工的信息。 数据集根据模型生成的风险分数对数据集进行排序,以显示员工。
- 在 “月范围 ”字段中,设置要分析数据的月份范围。
- 在 “风险分数范围 ”字段中,设置风险分数范围。 若要深入了解可能的欺诈活动,请将分数范围保持在较高水平。
按 月 的“风险评分”图表指示与员工关联的事件欺诈的可能性。 风险分数范围为 0-559 不太可能是欺诈性的,560-999 很可能是欺诈性的。 该图表显示与所选员工关联的风险分数,而与整个员工的平均风险分数相比。
按百分位影响风险评分的所有原因列出了影响风险评分的特定原因,按百分位排名。 网格中突出显示了重要的百分位。
原因详细信息
- 若要查看原因详细信息,并进一步分析该原因对风险评分的影响,请从“ 原因 ”下拉列表中选择五个原因之一。
按 月 图显示原因或事件的详细信息。
最高风险终端
- 若要查看顶级风险终端上的数据,请选择“ 终端 ”选项卡。
此屏幕截图显示的信息包括至少一个月的阈值为 760 或高于阈值的最高风险终端。
- 在 “月范围 ”字段中,设置要分析数据的月份范围。
- 在 “风险分数范围 ”字段中,设置风险分数范围。 若要深入了解可能的欺诈活动,请将分数范围保持在较高水平。
“ 数据摘要 ”部分提供终端评估的摘要。 它显示模型分析的唯一终端 ID 总数、报告数据期间唯一终端异常的次数,以及平均风险评分(0(零)到 999。
- 若要搜索与特定终端相关的数据,请在搜索字段中输入终端 ID。
最高风险终端网格列出所有终端 ID。 最高风险终端显示在列表顶部。 该网格还显示每个终端的平均分数,以及每个终端在报告评估的完整数据期间被视为异常的次数。
原因详细信息
- 若要查看原因详细信息,并进一步分析该原因对风险评分的影响,请从“ 原因 ”下拉列表中选择五个原因之一。
按 月 图显示原因或事件的详细信息。
终端的风险分数摘要
为了更好地了解特定终端的工作原理,一个有用的工具是趋势分析,该分析将特定终端的分数与整个总体的分数进行比较。 以下屏幕截图中的示例图表按月显示风险评分的变化。
终端 的风险分数摘要 部分显示最大分数、平均分数以及此特定存储或终端异常的次数。
将鼠标悬停在图表中的特定数据点上时,将显示终端的风险评分和整个总体的平均风险分数。 在以下示例中,锯齿模式是此终端在异常行为方面来回移动的事实的良好表示形式。
该模型使用五到六个默认事件生成风险分数。 它考虑返回比率,即员工在特定终端发起的回报总数,除以给定期间该终端的销售总额。 它还考虑了现金到卡比率以及使用多个付款卡的员工折扣购买数量。 最后,它考虑没有收据的回报与收据的回报比率,以及未折扣销售的折扣项目的数量。
终端原因摘要
若要了解每个事件或原因如何影响风险评分,请查看有关报表的以下信息。
“按百分位”部分影响分数的所有原因中的网格列出了影响风险评分的特定原因,按百分位排名。 重要的百分位数突出显示。
在“原因详细信息”部分的“原因”字段中,可以从“按百分位网格影响分数的所有原因”中选择任意原因,以进一步分析该原因对风险评分的影响。
“原因详细信息”图表按月显示你在“原因”字段中选择的原因或事件的值。
交易(过去六个月)
报表 的“事务”(过去六个月) 部分显示过去六个月在终端发生的特定事务。
正如网格显示的列标题所示,网格中的数据包括根据收据、交易 ID、员工 ID、购买金额、折扣金额、退货金额、返回收据是否存在、付款方式和类别显示交易日期。
如果与事务关联的员工成员被模型标记为异常,则网格中员工 ID 旁边会显示一个红色警告符号。 此警告标志将员工标识为高风险成员。
现有商务客户的说明
如果你是现有商务客户,则所有必填字段在数据类型中都具有 NOT NULL 约束。 有关架构参考,请参阅 Dynamics 365 欺诈保护中数据丢失防护的数据架构。 但是,还可以将 Commerce 配置为直接与欺诈保护共享数据。
有关如何将 Commerce 与欺诈连接集成并连接到欺诈保护的信息,请参阅本文档前面的“商业”部分连接数据丢失防护。 丢失防护没有先决条件架构工作。
祝贺你! 你已成功完成培训,并已准备好使用欺诈保护的损失防护功能的免费试用版。
后续步骤
有关如何访问和使用欺诈保护功能的信息,请参阅以下文档: