通过


非结构化数据作为知识源

通过使用 Copilot Studio,您可以利用通过 Power Platform 连接器构建的相同可信赖且熟悉的数据源,来为您的代理增强特定领域的知识。

从您的设备、OneDrive或SharePoint上传外部内容时,可以用针对业务定制的上下文知识来丰富代理的能力。 Microsoft Dataverse安全地存储这些文件,并自动将其处理成语义索引和矢量嵌入。 此配置能使智能体基于您提供的信息生成更准确、更可靠的响应。

Copilot Studio 中上传的文件使用 Microsoft Dataverse 引入原始文件并创建索引和矢量嵌入。 这些索引和嵌入有助于为您的代理提供高质量的回答。 可以从计算机或连接到OneDrive或SharePoint上传这些文件。

当你上传文件作为知识源时,你帮助代理人获得额外数据,增强语言模型的知识,并让代理人基于你提供的具体信息。 可以上传各种文件,系统通过语义处理将这些文件索引为矢量嵌入,然后将其用作智能代理的知识。 您可以与智能体的经过身份验证和未经身份验证的用户共享在智能体中使用的知识。

图中描述了代理制造商与代理用户之间的交互,以及知识源如何检索要提供给用户的信息。

为了提升代理的响应,系统会将上传的文件分块以加快处理速度,并对其进行矢量索引,以与用户查询提供语义匹配。 系统将文件安全地存储在Dataverse中。 当用户通过代理查询时,Copilot Studio 找到与用户查询意向匹配的最相关的区块,并将结果返回给用户。 

同样,Dataverse 引入 OneDrive 文件、SharePoint 文件(通过使用文件上传下的选项),以及来自 Salesforce、ServiceNow、Confluence 和 Zendesk 等其他企业系统中的知识库文章的非结构化内容,为代理提供更好的语义结果。

备注

“使用代码解释器分析结构化数据”中了解详细信息。

Power Platform 非结构化数据连接器

以下 Power Platform 连接器 适用于非结构化数据源:

OneDrive

通过使用 OneDrive,可以使用文件选择器界面来选择要包含的文件和文件夹。 一旦选中,系统会将这些项目检索到 Dataverse 并进行索引以便使用。 你添加的文件夹包括该文件夹内所有支持的文件和子文件夹,直到 总文件限制

SharePoint

使用 SharePoint 连接器通过文件选择器界面选择文件和文件夹。 选择这些项后,连接器会将它们检索到 Dataverse 中,并为其编制索引以供使用。 添加文件夹时,将包含该文件夹中所有受支持的文件和子文件夹,直到达到总文件限制为止。 目前,连接器不支持 Pages。

备注

当 SharePoint 用作知识源时,Copilot Studio 通过 SharePoint 搜索索引检索内容,而不是直接读取列表视图(如AllItems.aspx)。 在搜索索引完成之前,新添加或更新的 SharePoint 项可能无法提供给代理。 确保代理具有所需的权限,例如Sites.Read.AllFiles.Read.All,内容以受支持的文件格式存储。

Salesforce

Salesforce 连接器支持检索包含知识文章的知识库中的非结构化数据。 选择知识库,连接器会为该知识库中的所有项目编制索引。 你不能单独选择文章或主题。 查询数据时,你不能指定具体的文章或知识库。 知识列表会显示您在创建源时选定的所有知识对象的单一对象。

ServiceNow

ServiceNow 连接器支持从非结构化数据中检索包含知识文章的知识库。 知识库包含文章。 选择知识库,连接器会为该知识库中的所有项目编制索引。 你不能单独选择文章。 查询数据时,你不能指定知识库、文件夹或单独的文章。 知识列表会显示您在创建源时选定的所有知识对象的单一对象。

Confluence

非结构化数据的 Confluence 连接器支持检索包含页面的空间。 连接器还支持子文件夹。 你不能单独选择页面。 查询数据时,你不能指定页面。 知识列表仅显示空间内所有页面的单一对象。

Zendesk

Zendesk 连接器支持从非结构化数据中检索包含文章的知识库。 你不能单独选择文章、分类或章节。 查询数据时,你不能指定文章、类别或章节。 知识列表仅显示知识库内所有文章的单一对象。

安全性

当用户查询使用 Power Platform Connector 源的代理时,系统将执行授权检查。

连接器访问

首次使用基于连接器的源时,系统会提示你选择现有的 Power Platform 连接器或添加一个。 此过程可确保仅与有权访问数据源的制造商共享数据。

内容访问

当用户进行查询时,系统会利用其连接信息检查数据源并验证其是否有权限查看内容。 尽管系统在Dataverse中本地存储区块和索引,但它会对查询进行实时检查,确保当前用户能够访问数据,然后才提供摘要或回复。

备注

  • 如果用户没有对特定文件集或知识库文章的权限,系统不会返回结果给他们。 相反,他们会收到一条标准信息,上面写着“找不到任何结果”。如果用户认为该数据源应该有结果,他们需要与管理员合作,确保管理员对他们想要访问的数据拥有权限。 用户需要为其分配一个合适的Dataverse安全角色,例如 基本用户角色
  • 系统不会在本地存储内容权限信息。 它会实时对源端进行所有权限检查,确保它们是最新的。

同步与文件刷新频率

计划的同步作业保持OneDrive和SharePoint中的连接文件和非结构化知识库文章始终更新。 该任务在后台自动运行,通过刷新文件内容并重新索引变更项来确保查询结果准确性。 刷新机制不仅处理内容变更,还确保源头已删除内容不再出现在任何查询响应中。 目前,无法手动触发刷新。

有关刷新频率计时的详细信息,请参阅 Copilot Studio 非结构化数据源限制

许可

涉及知识的所有请求都按Microsoft Copilot生成答案消息传送费率收费。 更多信息请参见计费率和管理。

如果知识源需要数据摄取,数据的存储及其相应的索引将受客户存储权限的约束。 有关Dataverse自然语言搜索的更多信息,请参见 “增强Dataverse搜索的AI驱动体验”。

限制和局限性

当你首次启用非结构化数据支持时,Dataverse可能需要5到30分钟来配置和索引,然后才处理新增的文件。 所需时间取决于当前 Dataverse 环境的规模。

每个智能体最多可包含 500 个知识对象。 这些对象可以是文件、文件夹、知识条目、网站或其他来源。

此时,一位代理一次只能使用五种不同的信息来源。 例如,SharePoint、Dataverse、OneDrive 或其他源。

有关受支持的非结构化数据源的特定限制和限制的详细信息,请参阅 Copilot Studio 非结构化数据源限制

备注

Copilot Studio代理需要使用Dataverse搜索来访问此知识源。 若无法向代理添加启用 Dataverse 的文件,请联系管理员启用环境中的 Dataverse 搜索功能。 有关 Dataverse 搜索以及如何管理它的详细信息,请参阅 什么是 Dataverse 搜索配置环境的 Dataverse 搜索

若要访问 Dataverse 中存储的OneDrive和SharePoint内容,用户必须至少具有Power Apps或Dynamics 365的基本用户许可证。 此外,基本用户权限还必须包含以下表和实体的读取权限:

可以在 Power Platform 管理中心或 Dynamics 365 管理中心中配置这些权限。

FAQ

添加知识中的两个 SharePoint 选项有何区别?

Add knowledge 对话框中,会看到两个SharePoint选项。

添加知识对话框的截图,突出显示了两个 SharePoint 选项。

文件上传部分(1)中的SharePoint选项用于将单个SharePoint文件或文件夹上传到代理。 此选项将文件的副本从 SharePoint 上传到 Dataverse,并维护同步关系,使文件保持最新状态。 在查询期间,可以访问SharePoint来验证内容的用户权限。 Dataverse 存储的文件占用数据存储空间,但提供完整文档语义搜索功能,并支持某些文档类型(如 PDF 文件)中图像内的文本处理。

如果需要实时同步,而不是上传到 Dataverse 的静态文件,请使用选项 1。 当源文件被更改时,它会自动更新。

另一个 SharePoint 选项 (2) 使用 SharePoint 连接器在 Copilot Studio 中提供了完整的SharePoint集成。 如果需要完整的SharePoint连接器功能、自定义身份验证配置或高级查询选项,请使用此选项。

运行时差异

情景 选项 1:文件上传 选项 2:SharePoint 连接器
内容存储 从 SharePoint 复制到 Dataverse 驻留在 SharePoint 中
搜索功能 搜索从从 SharePoint 复制的引入内容的嵌入矢量生成的 Dataverse 语义索引 直接查询 SharePoint 搜索基础结构
内容新鲜度 根据引入完成情况,内容每四到六小时同步一次 实时并反映最新的可用内容
SharePoint 列表 支持 不支持
Dataverse 存储消耗 是的,适用于复制的文件和搜索索引。
高级查询筛选器 不可用 按标题、作者、修改者、修改日期进行筛选

选项用法

在以下情况下使用选项 1:

  • 你需要对 SharePoint 列表的支持
  • 代理仅使用一组特定的文件或文件夹
  • 想要由矢量嵌入驱动的高质量语义搜索
  • 内容刷新间隔为 4 到 6 小时已足够

在以下情况下使用选项 2:

  • 内容同步不会延迟,例如频繁更新的 Wiki 或公告网站
  • 需要避免 Dataverse 的资源消耗,特别是当涉及到大型文档库时。
  • 使用 高级查询筛选器,例如基于作者、修改日期或标题进行筛选

备注

这两个选项都需要用户身份验证。 在代理从 SharePoint 内容检索结果之前,用户可能会登录。 详细了解 Copilot Studio 非结构化数据知识源限制中的同步计时和文件限制。

为什么“添加知识”对话框的“上传文件”部分中不显示 SharePoint 图标?

安装解决方案后稍有延迟,直到它出现在所有现有组织中。 要手动触发更新,请按照以下步骤操作:

  1. 使用管理员凭证登录 Power Platform 管理中心

  2. 在侧栏中,选择“ 管理”。

  3. 从产品列表中选择Dynamics 365应用

  4. 搜索 poweraiextensions

  5. 选择三个点(…)以获取Microsoft Dynamics 365 - PowerAIExtensions,然后选择安装

  6. 从下拉菜单中选择环境,然后选择“ 安装”。

  7. 安装完成后,在新窗口中打开 Power Apps

  8. 在左侧窗格中,选择解决方案

  9. 选择“详细信息”。

  10. 验证 PowerAIExtensions 解决方案定位点 的版本是否设置为 1.01.688 或更高版本。

向我的智能体添加超过500个知识对象会产生什么效果?

除非先删除之前的对象,否则你不能添加更多对象。

每个代理是否都有自己的知识源索引?

Dataverse 在你创建的环境中存储知识源,以供使用。 如果多个代理使用相同的SharePoint文件夹,则所有代理都使用该文件夹的单个实例。

如果在添加SharePoint或OneDrive源时选择的文件、文件夹和子文件夹数超过最大数目的文件夹,会发生什么情况?

Copilot Studio 检索和索引文件、文件夹和子文件夹时达到最大的数量上限。 它不处理剩余的项,并且不指示正在处理或未处理哪些项。

我添加的文件之一显示为知识源的一部分,但我无法从中获取答案。 为什么?

此问题可能与以下原因之一相关:

  • “知识”页不会将文件或文件夹报告为“就绪”。
  • 文件名包含不受支持的字符(特别是 SharePoint 文件)。
  • 该文件具有 机密高度机密的敏感度设置,或者具有密码保护。
  • 不支持文件类型。
  • 文件或文件夹来自其他用户的 OneDrive 或 SharePoint 网站,并且用户未与你共享。
  • 该文件是知识库文件,你的帐户没有查看源系统中的内容所需的权限。