本文概述了在 Fabric 中 Copilot 上下文中选择的关键术语及其定义。 当你阅读有关 Fabric 中的 Copilot 的文章时,或者使用 Copilot 并需要有关术语或名称含义的提醒时,请参考这些术语。
术语 | 定义(在 Fabric 中的 Copilot 上下文中) |
---|---|
Azure AI 搜索 (前 Azure 认知搜索) |
一个搜索和检索系统,其中包含一套全面的高级搜索技术,专为任何规模的高性能应用程序而构建。 Azure AI 搜索在 Azure OpenAI 服务和 Azure 机器学习之间提供本机 LLM 集成,在 Azure 上生成基于 RAG 的应用程序时,它是建议使用的首选检索系统。 , 使用 Azure AI 搜索可以创建自己的 Copilot。 |
Azure OpenAI 服务 (Azure OpenAI) |
提供对 OpenAI 语言模型的 REST API 访问权限。 Azure OpenAI 服务是一种Microsoft托管服务,不使用公共 OpenAI 服务或资源。 Copilot 将预处理的输入发送到 Azure OpenAI,以便可以处理输入。 处理后,Azure OpenAI 将 LLM 响应返回到 Copilot 进行后处理。 无法在 Fabric 中查看、访问或修改用于 Copilot 的 Azure OpenAI 服务。 |
容量单位(OU) | 如何使用 Microsoft Fabric 容量指标应用来衡量容量使用情况。 你拥有的 CU 数量取决于 Fabric 容量 SKU;SKU 越高,可用的 CU 数量就越多。 当你使用了 100% 的可用 CU 时,可能会进入限制状态,这可能会导致性能下降和出错。 Fabric 中的 Copilot 消耗可用的 Fabric CU。 |
容量使用情况 | 所有容量操作的计算影响。 Fabric 中的 Copilot 是一个消耗容量的后台操作。 |
Fabric CU 的消耗 | Fabric CU 的使用。 与产能利用率的同义词。 使用 Fabric 中的 Copilot 会消耗 Fabric CU。 |
副驾驶员 | 一种生成式 AI 助手,旨在增强 Fabric 平台中的数据分析体验。 每个工作负载中有不同的 Copilot,根据你使用的项和 UI,Copilot 体验有所不同。 |
嵌入(在 LLM 上下文中) | 将令牌转换为实数的密集向量的过程。 嵌入根据句子或段落中给定标记两侧的其他标记,为 LLM 提供给定标记的语义含义。 |
经验 | Copilot 的功能模块,例如 DAX 查询体验(生成 DAX 代码)和报表页生成体验,后者为 Power BI 报表页生成视觉对象。 使用 Fabric 中的 Copilot 时,你将使用不同的 Copilot 体验。 每个工作负载和项可能有多个经验。 |
基础模型 | OpenAI(用于 GPT 模型)或 Anthropic(用于 Claude 模型)等供应商提供的基本模型。 每个模型都有自己的训练数据,其工作方式不同,例如使用不同的方法来标记和处理输入以生成响应。 Fabric 中的 Copilot 使用 Microsoft 在 Azure OpenAI 服务中托管的 OpenAI 的 GPT 基础模型。 无法自行更改或微调这些模型。 |
生成式 AI | 一种人工智能形式,其中模型经过训练,以基于自然语言输入生成新的原始内容。 Fabric 中的 Copilot 是一种利用生成式 AI 技术的工具,它试图增强 Fabric 平台中的数据分析体验。 |
上下文关联 | 检索其他上下文信息的预处理技术,用于增强 LLM 响应的特定性和有用性。 上下文关联数据始终特定于用户,并遵守项的权限和任何强制实施的数据安全措施。 Fabric 中的 Copilot 在输入提示的预处理期间执行上下文关联操作,这可能涉及到从当前活动的 Copilot 会话、项元数据或特定数据点检索信息。 |
输入 | 为 Copilot 提供的提示或交互,这会启动 Copilot 进程。 Fabric 中的 Copilot 使用不同的输入;主要是用户编写的自然语言输入,或者用户与按钮或类似 UI 元素交互时生成的自然语言输入。 |
大型语言模型 (LLM) | 使用大型文本语料库训练的深度学习模型,用于生成文本。 大语言模型(LLM)基于自动回归模型的理念,这些模型经过训练,可以根据之前的单词预测下一个单词(或可能性最大的一些单词)。 LLM 可用于处理大量的文本,并学习人类语言的结构和语法。 Fabric 中的 Copilot 利用 OpenAI 的 GPT 系列 LLM,这些 LLM 托管在 Azure OpenAI 服务中。 |
元提示 | 不是由用户提供的提示。 元提示由 Copilot 提供,由 Microsoft 配置。 每个 Copilot 体验都使用自己的元提示来提高 Copilot 输出的特定性和有用性。 例如,DAX 查询 Copilot 体验使用包含多个 DAX 查询和表达式示例的元提示。 |
自然语言 | 自然发生或对话的语言。 Fabric 中的 Copilot 可以从自然语言提示接收用户输入。 |
Fabric 的操作 | Fabric 中发生的活动,导致使用容量。 用户与 UI 交互(如报表视觉对象生成的数据模型查询)可以触发的按需请求和操作,被归类为 交互式 操作。 运行时间较长的操作(例如语义模型或数据流刷新)被归类为后台操作。 Fabric 中的 Copilot 是一个后台操作。 |
业务流程协调程序 | Copilot 预处理期间的任务,用于确定 Copilot 应使用哪些技能或工具。 业务流程协调程序通过使用输入期间提供的元提示中的系统信息来确定这一点。 |
输出 | Copilot 在完成后期处理后返回给用户的内容。 输出可能包含低质量和不准确的内容,因此用户应在进一步使用或决策之前对每个输出进行关键评估。 Fabric 中的 Copilot 可以返回不同的输出,这具体取决于用户正在使用的体验。 |
预处理 | Copilot 执行的活动,包括获取和增强用户输入,或检索其他信息,以便生成更具体且有用的输出。 |
后处理 | Copilot 执行的活动,在其中获取、筛选和处理 LLM 响应以生成最终输出。 后处理活动因个人正在使用的特定 Copilot 体验而有很大差异。 |
提示 | 用户以自然语言编写的 Copilot 输入,或 Copilot 为响应用户交互而生成的输入。 |
Q&A(Power BI 功能) | Power BI 中的一项功能,可让你使用自然数据提问数据并获取响应。 Q&A 使用自然语言处理,但不使用生成 AI。 Fabric 中的 Copilot 可用于增强 Q&A 体验;例如,它可以为语言建模生成同义词。 |
LLM 的响应 | 已处理的输入的结果。 LLM 响应始终是文本,但该文本可以是自然语言、代码或元数据。 |
负责任 AI (RAI) | 理论上,如果这些指导原则和实践被遵循,应该能够减轻风险,并改善 AI 的道德使用。 |
检索增强生成 (RAG) | 通过添加一个提供基础数据的信息检索系统来增强 LLM 功能的架构。 Fabric 中的 Copilot 在预处理期间使用 RAG。 |
技能 | Copilot 体验中的一项特定任务。 例如,筛选报表页是 Copilot 报表页摘要体验的一项功能。 |
库存单位(SKU) | Fabric 容量的大小。 SKU 由字母 F 指示,后跟数字,例如 F2 或 F8。 较大的数字对应于较大的 SKU。 Fabric 中的 Copilot 仅适用于 F2 或更高版本的 SKU。 试用容量目前不支持 Copilot 和 AI 功能。 |
平滑化 | Fabric 中的一个进程,其中后台操作的容量使用分布在 24 小时窗口内(从操作开始到正好 24 小时结束)。 平滑化操作可以减轻高峰并发使用对 Fabric 容量的影响。 由于它是一项后台操作,Fabric 中的 Copilot 的所有容量使用量都已平滑化。 |
令 牌 | LLM 使用的最小信息单位。 标记由频繁同时出现的文本中的一个或多个字符组成。 每个令牌都有给定 LLM 的相应唯一整数,称为 令牌 ID。 令牌是将自然语言转换为数字表示形式所必需的,这是 LLM 用于处理输入和返回响应的方法。 |
标记化 | 将自然语言输入转换为令牌的过程。 令牌化由 LLM 完成,不同的 LLM 以不同的方式对输入进行标记。 |
工作量 | Fabric 的不同功能领域,如数据工程、数据科学或 Power BI。 Fabric 中的不同工作负载使用不同的 Copilot。 每个工作场景中都有不同的 Copilot 功能体验。 |