当你为他们配备扩展核心能力的专用工具时,代理会变得更强大。 Copilot Studio 提供三大类代理工具:
本文将探讨每种工具类型的工作原理、使用时机,以及它们如何帮助您打造更有能力、更高效的代理。 你还了解了托管设备和自带设备在计算机使用场景中的区别,以及关于如何在传统机器人流程自动化(RPA)和计算机智能体(CUA)方法之间选择的指导。
利用AI提示生成回复
AI提示使用一组指令从AI模型生成响应。 你可以在这些指令中加入变量,插入更多文本或文档。 输出通常以纯文本或 JSON 格式提供。 你可以选择任何内置于 Copilot Studio 或通过 Microsoft Foundry 部署的 AI 模型来生成响应。
你可以作为代理工具调用提示,也可以在主题内调用。 所有提示都保存在提示库中,支持应用生命周期管理、基于角色的访问控制和共享。
了解更多 关于使用提示让你的代理执行特定任务的方法。
确定何时使用AI提示,何时使用编排器
每个在 Copilot Studio 中构建的代理都使用 编排器 ,根据系统指令、用户输入和上下文信息选择工具、主题和知识来确定响应方式。 编排器是生成编排背后的引擎,生成编排利用代理的工具和描述来规划动作并组合响应。
虽然由编排器驱动的响应看似类似于 人工智能提示,但这两者有不同的作用。 AI提示是独立的基于提示的动作,赋予制作者对模型配置更深的控制权。
AI提示支持更广泛的模型,包括 通过Microsoft Foundry提供的模型。 它们还支持诸如 Dataverse 接地、 文件输入和 代码解释器等功能。
编排器使用固定的系统提示和工具描述,为特定请求选择合适的构建模块。 制作者无法编辑编排器的系统提示,但可以通过 代理指令影响其行为。
AI提示词能完全控制格式、约束和逻辑,是需要精细或高度结构化输出场景的合适选择。 例如,如果你需要超越简单格式化的风格控制(“用这些词用ABAB结构写一首押韵诗”),提示词会更合适。
编排器非常适合简单任务,比如从文本中提取单个名字。 对于复杂的提取,可以使用AI提示。 例如,从一份长报告中提取多个实体,并将其关联到特定领域的关系(例如从保险报告中提取多个名字,并识别仅与事件中某一方关联的汽车维修服务业主)。
选择编排器提示和 AI 提示取决于所需的定制程度。 如果你需要对模型的行为或输出进行精确控制,可以选择AI提示。 对于一般推理、工具选择和轻量级格式即可的场景,编排器是合适的选择。
通过使用 MCP 集成代理工具
模型上下文协议(MCP)是一个通用接口,AI模型用于以一致且可扩展的方式与外部工具、数据源和用户环境交互。
相比之下,Power Platform 连接器要求你描述每个动作及其输入,并在新定义出现时更新这些描述。 为每个工具定制编码和集成更复杂,且扩展性较低。
使用Copilot Studio提供的MCP服务器,用于Microsoft服务如Outlook、Dataverse和GitHub,或第三方服务如Salesforce和JIRA。 为没有MCP服务器的服务构建自定义MCP服务器。
MCP的益处包括:
- AI模型的标准化上下文
- 与 Copilot Studio 无缝集成
- 提升开发者效率和用户体验
- 治理、监控与可扩展性
在实现MCP服务器之前,请考虑以下限制:
- 你无法通过更多关于何时调用的上下文来丰富工具描述。
- 主题不能直接调用MCP服务器。
了解何时使用MCP
你可以通过多种集成方法在Copilot Studio中实现同样的效果。 重要的是要明白何时使用模型上下文协议(MCP)服务器,而不是使用像Power Platform连接器或直接的REST API调用这样简单的选项。
当你需要一个标准化、集中管理的方式,将工具和资源暴露给多个代理,而无需按客户端配置时,可以使用MCP。 MCP服务器发布工具和资源,代理可以自动发现、版本并一致使用,因为MCP服务器定义了工具描述及其输入。 相比之下,直接添加 API 需要你手动描述其目的并定义每个代理的输入。
当上游API频繁更换时,MCP尤其有价值。 你不需要更新所有使用该API的代理,只需在MCP服务器上修改一次定义,所有代理就会自动使用更新后的版本,无需重新发布。 如果没有MCP服务器,或者你正在快速原型开发,直接调用API更快,也避免了引入完整MCP生命周期所需的设置开销。
必须启用生成式业务流程才能使用 MCP。 了解更多内容,请参阅 《MCP如何运作?》
通过使用计算机使用工具自动化桌面流程
通过使用 计算机使用工具,代理可以在无需自动化脚本或API的情况下作计算机。 你不是用脚本或 API,而是通过提示符来配置代理。 代理人决定如何最好地实现其目标。 在这个过程中,代理在每一步截图,分析以决定下一步作,执行该动作,并重复这个循环直到任务完成。 客服截取的截图和推理步骤会作为运行历史的一部分提供。
代理可以从计算机使用工具中受益的常见情景包括:
- 数据录入:对于收到的CSV文件中的每一行,在SAP中创建销售订单,并将生成的订单ID写回文件。
- 数据提取:访问每个供应商门户,搜索列出的SKU,提取价格、库存和交货时间,并将带有时间戳的结果插入数据库。
- 跨应用:从桌面金融客户端导出当天的交易,使用QuickBooks,并将每笔记录发布到正确的账户。
区分托管机器和自带机器
代理可以在Microsoft托管的机器或自带设备(BYO)设备上调用该计算机使用工具。 托管机器可立即使用,无需IT配置或计费。 它们属于一个共享的预配置 Windows 365 云 PC 池,这些 PC 并未通过 Entra 加入客户租户。 BYO 机器必须提前在客户自己的虚拟网络中配置。 您必须在Power Automate中注册和管理BYO机器。
生产场景使用自带机。 他们支持Microsoft Entra ID,注册Intune,并支持网页和桌面自动化用例。 由于主机功能有限,只能使用主机进行原型制作。 每个用户同时只能使用一台云端电脑,并且可以根据需求限制使用。
在 “配置计算机使用位置”中了解详细信息。
机器人流程自动化(RPA)与计算机代理(CUA)
机器人流程自动化(RPA)是 利用脚本对计算机进行自动化。 你可以把它应用到很多和CUA相同的场景上。 然而,了解RPA和CUA之间的区别非常重要。
| 方面 | RPA | CUA |
|---|---|---|
| 自动化类型 | 基于规则的 | 以LLM驱动 |
| 交互方法 | 用户界面树 | 视觉 |
| 创作 | 复杂文字 | 自然语言指令 |
| 决策过程 | 预定义规则 | 基于视觉的自主决策 |
| 灵活性 | 灵活性有限 | 高度柔韧性 |
| 错误处理 | 静态错误处理 | 基于视觉反馈的自我纠正 |
在以下情况下使用 RPA:
- 仅允许使用通用(GA)功能。
- 用户界面很稳定。 屏幕、场地和选择器很少更换。
- 规则很明确。 你可以用规则记录决策。
- 速度很重要。 大量使用。 每一秒都很重要。
- 一个RPA团队拥有它。 团队具备现有的RPA开发和管理知识。
在以下情况下使用CUA:
- 用户界面变化多端。 你要处理多个应用,并且经常进行重新设计。
- 你需要快点。 RPA团队的积压工作已经满了。
- 用户界面很重要。 任务取决于屏幕上可见的内容,比如图表、颜色和动态布局。
- 决策很模糊。 代理人必须推理、选择下一步,或自我纠正。