非结构化数据作为知识源

通过使用 Copilot Studio,您可以通过 Power Platform 连接器构建的可信且熟悉的数据源,增强您的座席领域特定知识。

当你从设备、OneDrive或SharePoint上传外部内容时,你可以为你的客服人员提供量身定制的情境知识。 Microsoft Dataverse 安全存储这些文件,并自动将其处理成语义索引和矢量嵌入。 此配置能使智能体基于您提供的信息生成更准确、更可靠的响应。

在 Copilot Studio 上传的文件使用 Microsoft Dataverse 来导入原始文件并创建索引和矢量嵌入。 这些索引和嵌入有助于为您的代理提供高质量的回答。 你可以从电脑上传这些文件,也可以通过连接OneDrive或SharePoint来上传。

当你上传文件作为知识源时,你帮助代理人获得额外数据,增强语言模型的知识,并让代理人基于你提供的具体信息。 你可以上传各种文件,这些文件作为向量嵌入进行语义索引,然后作为智能体的知识使用。 你可以将这些智能体使用的知识分享给已认证和未认证的智能体用户。

示意图展示了智能体创建者与用户之间的交互关系,以及知识源如何检索信息提供给用户。

为了提升代理的响应,系统会将上传的文件分块以加快处理速度,并对其进行矢量索引,以与用户查询提供语义匹配。 系统将文件安全地存储在Dataverse中。 当用户通过智能体进行查询时,Copilot Studio 会定位最符合用户意图的匹配片段并返回结果。 

同样,Dataverse 会从其他企业系统如 Salesforce、ServiceNow、Confluence 和 ZenDesk 获取 OneDrive 文件、SharePoint 文件(通过文件上传选项)以及非结构化内容,如知识库文章,以为代理提供更好的语义效果。

备注

有关结构化数据使用的更多信息,请参阅使用代码解释器分析结构化数据

Power Platform 非结构化数据连接器

以下 Power Platform 连接器已配置为与非结构化数据源配合使用:

OneDrive

OneDrive 允许制作者使用文件选择界面来选择他们想要包含的文件和文件夹。 一旦选中,系统会将这些项目检索到 Dataverse 并进行索引以便使用。 你添加的文件夹包括该文件夹内所有支持的文件和子文件夹,直到 总文件限制

SharePoint

SharePoint 允许创作者使用文件选择界面来选择想要包含的文件和文件夹。 选定后,这些项目将被导入到 Dataverse 中并进行索引以供使用。 你添加的文件夹包括该文件夹内所有支持的文件和子文件夹,直到 总文件限制。 目前,Pages没有任何支持。

Salesforce

Salesforce 非结构化数据连接器支持检索包含知识文章的知识库。 制作者选择一个知识库,该知识库中的所有文章都会编制索引以供使用。 你不能单独选择文章或主题。 查询数据时,你不能指定具体的文章或知识库。 知识列表会显示您在创建源时选定的所有知识对象的单一对象。

ServiceNow

ServiceNow 非结构化数据连接器支持检索包含知识文章的知识库。 知识库包含文章。 制作者选择一个知识库,该知识库中的所有文章都会编制索引以供使用。 你不能单独选择文章。 查询数据时,你不能指定知识库、文件夹或单独的文章。 知识列表会显示您在创建源时选定的所有知识对象的单一对象。

Confluence

Confluence 连接器支持非结构化数据,能够检索包含页面的空间。 连接器还支持子文件夹。 你不能单独选择页面。 查询数据时,你不能指定页面。 知识列表仅显示空间内所有页面的单一对象。

Zendesk

Zendesk 非结构化数据连接器支持检索包含知识文章的知识库。 你不能单独选择文章、分类或章节。 查询数据时,你不能指定文章、类别或章节。 知识列表仅显示知识库内所有文章的单一对象。

安全性

当用户查询使用 Power Platform Connector 源的代理时,系统会进行一些授权检查。

连接器访问

当制造商首次使用基于连接器的电源时,系统会提示他们选择现有的Power Platform连接器或添加一个。 此流程确保数据仅共享给具备相应权限的创建者,并提供数据源访问权限。

内容访问

当用户进行查询时,系统会利用其连接信息检查数据源并验证其是否有权限查看内容。 尽管系统在Dataverse中本地存储区块和索引,但它会对查询进行实时检查,确保当前用户能够访问数据,然后才提供摘要或回复。

备注

  • 如果用户没有对特定文件集或知识库文章的权限,系统不会返回结果给他们。 相反,他们会收到一条标准信息,上面写着“找不到任何结果”。如果用户认为该数据源应该有结果,他们需要与管理员合作,确保管理员对他们想要访问的数据拥有权限。 用户需要为其分配一个合适的Dataverse安全角色,例如 基本用户角色
  • 系统不会在本地存储内容权限信息。 它会实时对源端进行所有权限检查,确保日期最 up-to。

同步与文件刷新频率

定时同步作业保持 OneDrive 和 SharePoint 的连接文件,以及非结构化知识条目。 该任务在后台自动运行,通过刷新文件内容并重新索引变更项来确保查询结果准确性。 刷新机制不仅处理内容变更,还确保源头已删除内容不再出现在任何查询响应中。 目前,没有办法手动触发刷新。

有关刷新频率定时的更多信息,请参见 Copilot Studio 非结构化数据知识源限制

许可

所有涉及知识的请求均按 Microsoft Copilot 生成式答案消息费率计费。 更多信息请参见计费率和管理。

如果知识源需要数据摄取,数据的存储及其相应的索引将受客户存储权限的约束。 有关Dataverse自然语言搜索的更多信息,请参见 “增强Dataverse搜索的AI驱动体验”。

限制和局限性

当你首次启用非结构化数据支持时,Dataverse可能需要5到30分钟来配置和索引,然后才处理新增的文件。 所需时间取决于当前 Dataverse 环境的规模。

每个智能体最多可包含 500 个知识对象。 这些对象可以是文件、文件夹、知识条目、网站或其他来源。

此时,一位代理一次只能使用五种不同的信息来源。 例如 SharePoint、Dataverse、OneDrive 或其他来源。

有关支持非结构化数据源的具体限制和限制的更多信息,请参见 Copilot Studio 非结构化数据知识源限制

备注

Copilot Studio 智能体需要 Dataverse 搜索才能使用此知识源。 若无法向智能体添加启用 Dataverse 的文件,请联系管理员在环境中开启 Dataverse 搜索功能。 有关 Dataverse 搜索及其管理方法的详细信息,请参阅什么是 Dataverse 搜索为环境配置 Dataverse 搜索

要访问存储在Dataverse中的OneDrive和SharePoint内容,用户至少必须拥有Power Apps或Dynamics 365的基本用户许可证。 此外,基本用户权限还必须包含以下表和实体的读取权限:

你可以在 Power Platform 管理中心或 Dynamics 管理中心配置这些权限。

FAQ

在添加知识对话框中,两个 SharePoint 选项有何区别?

“添加知识 ”对话框中,你会看到两个SharePoint选项。

文件上传部分(1)中的SharePoint选项用于将单个SharePoint文件或文件夹上传到你的代理。 该选项将文件副本从 SharePoint 上传到 Dataverse,并保持同步关系以保持文件最新。 查询时,访问SharePoint以验证用户对内容的权限。 Dataverse 存储的文件确实占用数据存储,但为某些文档类型(如 PDF)提供了完整的文档语义搜索功能和图像文本支持。

如果你想要实时同步,而不是上传静态文件到 Dataverse,请使用选项(1)。 当源文件被更改时,它会自动更新。

另一个 SharePoint 选项(2)通过SharePoint连接器在Copilot Studio中提供完整的SharePoint集成。 当你需要完整的 SharePoint 连接器功能、自定义认证配置或高级查询选项时,可以使用这个选项。

添加知识对话框截图,突出显示两个 SharePoint 选项。

添加知识对话框的“上传文件”区域未显示 SharePoint 图标?

安装解决方案到解决方案显示在所有现有组织中,之间存在轻微延迟。 要手动触发更新,请按照以下步骤操作:

  1. 使用管理员凭证登录 Power Platform 管理中心

  2. 在侧边导航中选择管理

  3. 从产品列表中选择 Dynamics 365 应用。 将打开一个窗格。

  4. 搜索 "PowerAIExtensions"。

  5. 选择 Microsoft Dynamics 365 - PowerAIExtensions 的三个点(...),然后选择安装

  6. 从下拉菜单中选择您的环境,然后选择安装

  7. 安装完成后,在新窗口中打开 Power Apps

  8. 在左侧窗格中选择解决方案

  9. 选择查看历史记录

  10. 搜索“PowerAIExtensions_Anchor”,确保其版本为 1.01.688 或更高。

向智能体添加超过 500 个知识对象会怎样?

除非先删除之前的对象,否则你不能添加更多对象。

每个智能体是否拥有独立的知识源索引?

Dataverse 存储知识源,供你创建知识的环境使用。 如果多个代理使用同一个SharePoint文件夹,所有代理都会使用该文件夹的同一个实例。

如果在添加 SharePoint 或 OneDrive 来源时选择的文件夹包含超过最大数量的文件、文件夹和子文件夹,会发生什么情况?

Copilot Studio 将检索并索引最多达到最大数量的文件、文件夹和子文件夹,并对其进行索引。 其余未处理。 当前系统未提供处理状态反馈信息。

我添加的某个文件(或文件夹内文件)显示在知识源中,但无法从中获取答案。 为什么?

此问题可能由以下原因导致:

  • 该文件或文件夹在知识页面上被标记为“就绪”。
  • 确保文件名不含不受支持的字符(特别针对 SharePoint 文件)。
  • 确保文件没有设置为机密高度机密的敏感性级别,也没有启用密码保护。
  • 确保文件类型在支持范围内。
  • 如果文件或文件夹来自其他用户的 OneDrive 或 SharePoint 站点,请确认其已与创建者共享。
  • 若文件为知识库文件,请确认您的账户在源系统中具备查看内容的权限。