排查 Dynamics 365 客户透视 中的统一输出表问题 - 数据

输出表简介

数据统一过程的每个步骤都会生成系统生成的输出表。

若要对意外的统一结果进行故障排除,可以跟踪以下输出表:

步骤 说明
重复数据删除 Deduplication_{Datasource}_{Table} 每个源表的重复数据删除记录
匹配 ConflationMatchPairs 跨源表匹配的记录
合并 客户 统一客户配置文件

有关每个输出表的详细说明,请参阅 “了解输出表”。

查看输出表

方法 大小 重复数据删除 ConflationMatchPairs 客户
下载 100K 条记录 前 100K
设置导出 完全
创建沙盒环境 完全

方法 1:下载 10 万条记录

如果记录少于 100,000 条,请使用此方法。

在 客户透视 - 数据中,打开“表”页。 对于每个输出表,选择“下载以获取该表的最新 100,000 条记录。

显示如何下载输出表记录的屏幕截图。

若要确保此方法包含所有输出信息,请参阅 方法 3:创建沙盒环境

方法 2:设置导出

如果记录超过 100,000 条,请使用此方法。

对于每个输出表, 设置导出。 建议 导出到 Blob 存储

刷新所有导出,然后将完整表写入配置的位置。

方法 3:创建沙盒环境

创建新的沙盒环境 ,以重新创建包含原始表问题记录子集的表的统一配置。

此步骤确保 方法 1:下载 10 万条记录 包含所有输出信息。

数据源

创建仅包含一小部分问题记录的新表。 建议少于 100,000 条记录。

刷新表以将它们引入客户透视 - 数据。

统一问题表

  1. 映射问题表。
  2. 将原始重复数据删除规则复制到问题表。
  3. 对于每个问题表:
    • 复制原始匹配规则。
    • 启用 “包括所有记录 ”,以便更好地了解数据。
  4. 统一数据视图 步骤中,保留默认配置。
  5. 运行统一以生成客户配置文件。

解决统一结果

根据意外结果的位置,可能需要验证不同的输出表。

请参阅 说明统一结果的示例。

重复数据删除

若要验证重复数据删除是否按预期进行,请检查:

  • 有问题的结果的源数据
  • 重复数据删除配置

请确保考虑所有配置,例如:

  • 标准化
  • Precision
  • 异常
  • 合并首选项

请参阅“定义重复数据删除规则”中的重复数据删除概念和重复数据删除概念和方案中的示例的概述。

匹配

若要验证匹配是否按预期进行,请检查:

  • 有问题的结果的源数据
  • 相关的 重复数据删除 记录
  • 匹配配置

请确保考虑所有配置,例如:

  • 匹配顺序
  • 扩充
  • 标准化
  • Precision
  • 异常
  • 自定义匹配条件
  • 合并首选项

请参阅定义用于数据统一的匹配规则中的匹配概念的概述。

合并

若要验证合并是否按预期进行,请检查:

  • 有问题的结果的源数据
  • 相关的 重复数据删除 记录
  • 相关 联合会MatchPairs 记录
  • 合并配置

请确保考虑所有配置,例如:

  • 排除的字段
  • 群集
  • 合并首选项
  • 分组字段
  • 自定义 ID 生成。

请参阅“统一客户”列中合并行为的 概述,了解数据统一示例

了解输出表

重复数据删除表

重复数据删除表是由配置的规则删除的源表。 如果没有配置的规则,则源表在匹配规则中引用的列上重复数据删除。

类型 描述
PrimaryKey Source 字符串 配置的 源主键
PrimaryKey_Alternate 系统 字符串 为重复数据删除组标识的主键的串联列表
重复数据删除组...DeduplicationGroup_N 系统 字符串 基于重复数据删除规则的类似记录组的标识符
统治。。。Rule_N 系统 字符串 重复数据删除组匹配的重复数据删除规则
得分。。。Score_N 系统 双精度 重复数据删除规则返回的分数
Deduplication_WinnerId 系统 字符串 重复数据删除组的获胜主键
其他映射字段 Source 各种 源表中的剩余映射字段

ConflationMatchPairs 表

ConflationMatchPairs 表是基于已配置规则的匹配重复数据删除记录集。

类型 描述
TrueObjectId 系统 字符串 跨源表匹配的记录的临时标识符
PrimaryKey...PrimaryKey_N Source 字符串 匹配的源主键
PrimaryKey_Alternate...PrimaryKey_Alternate_N 系统 字符串 匹配的源主键的备用键
ConflationMatchPairs_ModifiedOn 系统 日期和时间 此匹配记录的最新更改的时间戳
其他匹配字段 Source 各种 源表中剩余的映射字段

Customer 表

Customer 表是基于统一字段的配置合并 ConflationMatchPairs 中的源列生成的最终客户配置文件集。

类型 说明
CustomerId 系统 字符串 配置文件的唯一 GUID 标识符
PrimaryKey...PrimaryKey_N Source 字符串 匹配的源主键
PrimaryKey_Alternate...PrimaryKey_Alternate_N 系统 字符串 匹配的源主键的备用键
统一字段 Source 各种 通过将统一字段配置应用到源字段来确定的最终字段

统一结果的示例

源表

MyData_Contact

ContactId FirstName 姓氏 电子邮件
1 汤姆森 monica.thomson@contoso.com
2 Monica Smith monica.thomson@contoso.com

MyData_Referral

Id FirstName 姓氏 EmailAddress ReferralDate
100 Moni 汤姆森 monica.thomson@contoso.com 2024 年 1 月 1 日凌晨 12:00
200 Monica Smith monica.thomson@contoso.com 2020 年 12 月 24 日上午 12:00

重复数据删除表

Deduplication_MyData_Contact

如果删除重复 Email数据:

ContactId ContactId_Alternate Deduplication_GroupId 规则 分数 Deduplication_WinnerId FirstName 姓氏 电子邮件
1 1;2 guid() DedupOnEmail 1.0 1 汤姆森 monica.thomson@contoso.com

Deduplication_MyData_Referral

如果删除重复 EmailAddress数据:

Id Id_Alternate Deduplication_GroupId 规则 分数 Deduplication_WinnerId FirstName 姓氏 EmailAddress ReferralDate
100 100;200 guid() DedupOnEmailAddress 1.0 100 Moni 汤姆森 monica.thomson@contoso.com 2024 年 1 月 1 日凌晨 12:00

ConflationMatchPairs 表

如果匹配:Contact.Email == Referral.Email

TrueObjectId Contact_ContactId Contact_ContactId_Alternate Referral_Id Referral_Id_Alternate ConflationMatchPairs_ModifiedOn Contact_FirstName Contact_LastName Contact_Email Referral_FirstName Referral_LastName Referral_EmailAddress Referral_ReferralDate
1__00 1 1;2 100 100;200 now() 汤姆森 monica.thomson@contoso.com Moni 汤姆森 monica.thomson@contoso.com 2024 年 1 月 1 日凌晨 12:00

Customer 表

如果按如下所示设置统一字段:

  • FirstNameContact.FirstName 优先于 Referral.FirstName.
  • LastNameContact.LastName 优先于 Referral.LastName.
  • 电子邮件Contact.Email 优先于 Referral.EmailAddress
  • ReferralDateReferral.ReferralDate 是采用的。
CustomerId Contact_ContactId Contact_ContactId_Alternate Referral_Id Referral_Id_Alternate FirstName 姓氏 电子邮件 ReferralDate
guid() 1 1;2 100 100;200 Moni 汤姆森 monica.thomson@contoso.com 2024 年 1 月 1 日凌晨 12:00