笔记本和 Fabric 数据代理中 Copilot 的隐私、安全性和负责任的使用

本文将介绍如何使用 Microsoft Copilot in Notebooks 和 Fabric 数据代理(前称为 AI 技能),如何保障业务数据的安全性和合规性,同时如何负责任地使用生成性 AI。 有关 Fabric 中 Copilot 的隐私、安全和负责任使用的主题概述,请参阅隐私、安全和负责任使用指南(预览版)。

数据使用

在 Fabric 中,Copilot 对笔记本数据的使用方式

  • 在笔记本中,Copilot 只能访问用户当前笔记本可访问的数据,无论是在附加的湖屋中还是由用户直接加载或导入到该笔记本中。 在笔记本中,Copilot 无法访问笔记本无法访问的任何数据。

  • 默认情况下,Copilot 有权访问以下数据类型:

    • 对话历史记录:该用户与 Copilot 之间的发送和回复消息的历史记录。 (有关存储聊天历史记录的更多详细信息,请参阅下文)
    • 用户执行的单元的内容。
    • 用户执行的单元格的输出。
    • 笔记本中数据源的架构。
    • 来自笔记本中数据源的示例数据。
    • 附加湖屋中外部数据源的架构。

Fabric 数据代理中的数据使用

  • Fabric 数据代理依赖于用户的聊天历史记录来更好地响应用户问题。 (有关存储聊天历史记录的更多详细信息,请参阅下文)
  • 添加的数据源的架构信息。 这包括表名称和列名称。 (数据代理的创建者选择应包含的表。

如何处理对话历史记录

对于 Notebooks 中的 Copilot 和 Fabric 数据代理,我们存储用户会话的对话历史记录。

为什么我们存储对话历史记录及其存储位置?

为了使用完全聊天代理 AI 体验,代理需要跨用户会话存储聊天历史记录才能维护上下文。 这可确保 AI 代理保留以前会话中用户询问的内容的上下文,并且通常是许多代理 AI 体验中所需的行为。 Copilot 等在笔记本和 Fabric 数据代理中的体验是存储用户会话期间对话历史记录的 AI 体验。

此历史记录存储在 Azure 安全边界、同一区域和处理所有 Fabric AI 请求的同一 Azure OpenAI 资源中。 在这种情况下,区别在于只要用户允许,对话历史记录就存储。 对于不跨会话存储会话历史记录的体验,不会存储任何数据。 提示仅由 Fabric 使用的 Azure OpenAI 资源处理。

用户可以随时删除其聊天历史记录,只需清除聊天即可。 此选项同时适用于笔记本中的 Copilot 和数据代理。 如果未手动删除对话历史记录,则会将其存储 28 天。

笔记本中的 Copilot:负责任的 AI 常见问题解答

借助 Microsoft Fabric 中用于数据科学和数据工程的笔记本中的 Copilot,我们提供了一个 AI 助手,可帮助在笔记本上下文中转换、探索和构建解决方案。

有关注意事项和限制,请参阅 限制

我们是如何在数据科学和数据工程的笔记本中评估 Copilot 的?

  • 产品团队测试了 Copilot,了解系统在笔记本上下文中的表现,以及 AI 响应是否具有见解和有用性。
  • 该团队还投资了其他损害缓解措施,包括将 Copilot 的输出集中在与数据科学相关的主题的技术方法上。

如何在数据科学和数据工程的笔记本中最佳使用 Copilot 来协作工作?

  • Copilot 最有能力处理数据科学主题,因此请将问题限制在此领域。
  • 请明确描述希望 Copilot 检查的数据。 如果描述数据资产(例如,通过命名文件、表或列)-Copilot 更有可能检索相关数据并生成有用的输出。
  • 有关更精细的响应,请将数据作为 DataFrame 加载到笔记本中,或将数据固定到 Lakehouse 中。 这为 Copilot 提供了执行分析的更多上下文。 如果资产太大而无法加载,将其固定是一种有用的替代方法。

Fabric 数据代理:负责任 AI 常见问题解答

什么是 Fabric 数据代理?

数据代理是一项新的 Microsoft Fabric 功能,可用于使用生成 AI 构建自己的聊天式 Q&A 系统。 Fabric 数据代理让组织中的每个人都能更轻松地获取数据见解,并将其转化为实际举措。 借助 Fabric 数据代理,你的团队可以就 Fabric OneLake 中存储的数据进行对话,使用纯英语问题进行对话,然后收到相关答案。 即使没有 AI 技术专业知识或对数据结构没有深入理解的人员也能获得精确且上下文丰富的答案。

数据代理可以做什么?

Fabric 数据代理支持与结构化数据的自然语言交互,使用户能够提问并接收丰富的上下文感知答案。 它使用户能够从 Lakehouse、Warehouse、Power BI 数据集、KQL 数据库等数据源进行连接和获取见解,而无需编写复杂的查询。 数据代理旨在帮助用户轻松访问和处理数据,通过对话界面增强决策,同时保持对数据安全和隐私的控制。

数据代理的预期用途是什么?

  • Fabric 数据代理旨在简化数据查询过程。 它允许用户通过自然语言与结构化数据进行交互。 它支持用户见解、决策和生成复杂问题的答案,而无需专门的查询语言知识。 数据代理特别适用于业务分析师、决策者和其他非技术用户,他们需要从 KQL 数据库、Lakehouse、Power BI 数据集和仓库资源等源中存储的数据中获取快速、可操作的见解。

  • Fabric 数据代理不适用于需要确定性和 100%% 精确结果的用例,这由于当前 LLM 的限制。

  • Fabric 数据代理不适用于需要深入分析或因果分析的用例。 例如,“为什么上个月销售额下降?” 已超过当前范围。

如何评估 The Fabric 数据代理? 哪些指标用于度量性能?

产品团队针对各种公共和专用基准测试了数据代理,以确定针对不同数据源的查询质量。 该团队还投资了其他损害缓解措施,包括确保数据代理的输出受限于所选数据源的上下文的技术方法。

Fabric 数据代理的限制是什么? 用户在使用系统时如何最大程度地降低 Fabric 数据代理限制的影响?

  • 请确保使用具有描述性的列名。 使用“ActiveCustomer”或“IsCustomerActive”,而不是“C1”或“ActCu”列名称(例如)。这是从 AI 中获取更可靠的查询的最有效方法。

  • 为了提高 Fabric 数据代理的准确性,可以使用数据代理说明和示例查询提供更多上下文。 这些输入有助于 Azure OpenAI 助手 API(为 Fabric 数据代理提供支持)做出有关如何解释用户问题和最适合使用的数据源的更好决策。

  • 可以使用数据代理说明来指导基础代理的行为,帮助它确定最佳数据源来回答特定类型的问题。

  • 还可以提供示例问题查询对,以演示 Fabric 数据代理应如何响应常见查询。 这些示例用作解释类似用户输入和生成准确结果的模式。 Power BI 语义模型数据源目前不支持示例问答对。

  • 有关数据代理当前限制的完整列表,请参阅 此资源

哪些作因素和设置允许有效和负责任的使用 Fabric 数据代理?

  • Fabric 数据代理只能访问你提供的数据。 它使用架构(表名和列名),以及你在用户界面(UI)中或通过 SDK 提供的 Fabric 数据代理说明和示例查询。

  • Fabric 数据代理只能访问用户可以访问的数据。 如果使用数据代理,您的身份验证信息将用于访问基础数据库。 如果无权访问基础数据,则数据代理无法访问该基础数据。 这是真的,当您在不同渠道(例如 Azure AI Foundry 或 Microsoft Copilot Studio)中使用数据代理时,其他用户也可以使用该数据代理。