你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
重要
本文中标记了“(预览版)”的项目目前为公共预览版。 此预览版未提供服务级别协议,不建议将其用于生产工作负载。 某些功能可能不受支持或者受限。 有关详细信息,请参阅 Microsoft Azure 预览版补充使用条款。
Microsoft Foundry游乐场按需提供即时对话环境,用于快速原型制作、API 探索和技术验证。 在编写任何一行上线代码之前,使用操场来试验模型并验证想法。
先决条件
- Azure订阅。 免费创建一个。
- 微软 Foundry 资源。
- Foundry 资源中至少有一个 已部署的模型 。
Foundry游乐场体验的亮点
Foundry平台体验的亮点包括:
- 智能体操场中对评估和跟踪的 AgentOps 支持。。
- 适用于聊天和代理操场的“在 VS Code 中打开”功能。 此功能通过自动将终结点和密钥从 Foundry 导入 VS Code 中的多语言代码示例来节省时间。
- Images Playground 2.0,适用于诸如 gpt-image-1、Stable Diffusion 3.5 Large 和 FLUX.1-Kontext-pro 等模型。
- Azure OpenAI Sora-2 的视频操场。
游乐场功能摘要
| Playground | 最适用于 | 关键功能 |
|---|---|---|
| 模型试验场 | 提示工程、模型比较、参数优化 | 最多比较三个模型,系统提示,工具(Web 搜索,文件搜索,代码解释器),安全防护栏,代码导出 |
| 代理人的乐园 | 利用工具和知识进行多轮智能体原型设计 | 工具配置, 知识源, 内存, 跟踪, 评估 |
| 视频乐园 (预览)1 | 视频生成工作流程 |
这是模型和智能体操场的一种模态 文本转视频, 提示迭代, 网格比较, 多语言代码示例 |
| 图像实验平台2 | 图像生成和编辑 |
这是模型和智能体操场的一种模态 文本转图像、图像修复、模型比较、多语言代码示例 |
1、2 Foundry 提供模型实验室和代理实验室。 当您使用沙盒来试验一个模型时,Foundry 会为您展示与该模型相关的沙盒。 例如,在使用图像生成模型(如 gpt-image-1)时,你会看到图像操场。 对于像 Sora-2 这样的视频模型,Foundry 会打开视频演示场。
为什么在生产之前使用操场
现代开发涉及在多个系统(API、服务、SDK 和数据模型)之间进行协作,通常是在您准备好完全投入框架、编写测试或启动基础设施之前。 随着软件生态系统的复杂性的增加,需要安全、轻型的环境来验证想法变得至关重要。 游乐场是为了满足这一需求而建造的。
Foundry游乐场提供所有必要工具和功能均已预先安装的即用型环境,因此您无需设置项目、管理依赖项或解决兼容性问题。 这些平台可以通过验证 API 行为、更快编写代码、降低试验成本和交付时间、加速集成、优化提示等方式来提升开发人员的开发速度。
当你有疑问时,游乐场可以迅速提供清晰的答案(而不是几个小时),并允许你在承诺大规模构建之前测试和验证想法。 例如,操场非常适合快速回答这样的问题:
- 获取所需输出所需的最小提示是什么?
- 在编写完整集成之前,此逻辑是否正常工作?
- 延迟或令牌使用情况如何随不同的配置而变化?
- 在将模型演变为代理之前,哪种模型提供最佳的性价比?
“在 VS Code 中打开”功能
通过模型操场和智能体操场,可以使用“在 VS Code 网页版中打开”按钮在 VS Code 中工作。 可以在模型场的聊天窗格中的“ 代码 ”选项卡中找到此按钮。
在多语言示例代码示例中提供,在适用于 Web 的 VS Code 中打开会自动将代码示例、API 终结点和密钥导入到 /azure 环境中的 VS Code 工作区。 借助此功能,可以轻松地通过 Foundry 门户在 VS Code IDE 中工作。
若要在VS Code for the Web 的模型沙盒中使用“在 VS Code 中打开”功能,请执行以下步骤:
- 部署模型并打开其测试环境。
- 在聊天窗格中选择“ 代码 ”选项卡。
- 从语言选项卡中选择首选编程语言。
- 选择在 Web 中的 VS Code 中打开以在新的浏览器选项卡中打开 VS Code。
- 已重定向到适用于 Web 的 VS Code 环境,其中代码示例、API 终结点和密钥已从 Foundry Playground 导入。
- 浏览
INSTRUCTIONS.md文件以获取有关运行模型的指南。 - 查看生成的文件中的代码示例和相关依赖项。
代理人的乐园
借助代理场,无需运行任何代码,即可浏览、原型和测试代理。 在此页中,可以快速迭代并试验新的想法。
注释
使用 Agents 试验场来测试模型时,Foundry 会为您提供该模型的相关试验场。 例如,在使用图像生成模型(如 gpt-image-1)时,你会看到图像操场。 对于像 Sora-2 这样的视频模型,Foundry 会打开视频演示场。
在智能体操场中,您可以:
- 配置代理指令和身份。
- 附加代码解释器、文件搜索和 Web 搜索等工具。
- 添加知识源以为智能体的回答提供依据。
- 测试与智能体的多回合对话。
- 通过 AgentOps 查看代理响应的跟踪和评估数据。
- 在部署之前保存并迭代代理配置。
若要开始使用代理操控台,请参阅 了解代理开发生命周期。
模型试验场
当在 Microsoft Foundry 门户中部署模型时,会立即进入其操场。 模型场是一种交互式体验,旨在帮助开发人员测试和试验来自Azure OpenAI、DeepSeek、xAI 和 Meta 等提供程序的最新模型。 平台提供对模型行为、安全和部署的完全控制,以便你可以微调系统提示、实时比较模型输出或集成 Web 搜索和代码执行工具。
注释
在模型实验环境中对模型进行试验时,Foundry 会为您提供该模型的相关实验环境。 例如,在使用图像生成模型(如 gpt-image-1)时,你会看到图像操场。 对于像 Sora-2 这样的视频模型,Foundry 会打开视频演示场。
该平台专为快速迭代和适应生产环境而设计。 它支持从原型制作到性能基准测试的所有内容。 操场可帮助你准备在生产工作流中使用模型,轻松地将模型升级为智能体,并在部署为智能体 Web 应用程序之前,使用额外的工具、知识和记忆继续在智能体操场中进行原型设计。
使用模型场的好处
全堆栈试验和控制:在单个环境中配置参数(如温度、top_p、max_tokens)、注入系统提示,并启用高级工具(如 Web 搜索、文件搜索和代码解释器)。 此设置允许您精确调整模型行为,并快速迭代提示词设计、基础和 RAG 工作流,将模型升级为代理。
内置安全和治理:分配或创建防护措施,防止越狱、间接提示注入和不安全输出。 此集成安全层可确保在受控、可测试的沙盒中验证合规性和负责任的 AI 行为,而无需连接外部审查逻辑。
内置比较功能和可部署性:可同时比较三个模型,输入/输出同步,以衡量响应质量为基准。 导出多语言代码示例,提取终结点和密钥,并在 VS Code 中打开,以便立即集成,在一个简化的开发人员工作流程中将试验联接到生产。
比较模型
通过比较模式,开发人员可以使用同步的输入流同时跨最多三个模型运行受控并行评估。 每个模型接收完全相同的提示上下文、系统消息和参数配置,确保输出基准测试的一致测试条件。 响应实时流式传输,使开发人员能够并排测量和可视化延迟、令牌吞吐量和响应保真度的差异。
若要在已部署模型的测试环境中使用比较模式,请执行以下步骤:
- 选择右上角的 “比较模型 ”。
- 从现有部署或新部署中选择最多两个模型。 所选模型的聊天窗口在操场上并排打开,并带有同步的提示栏和设置。 如果需要,可以从每个模型的 “设置 ”窗格关闭同步。
- 在任何提示栏中输入提示符,并查看提示同时显示在其他提示栏中。
- 提交提示以查看每个模型的输出,并比较响应的质量。
- 切换到每个模型的聊天窗格中的“ 代码 ”选项卡以查看多语言代码示例。
- 对于首选模型,请从代码选项卡中选择“ 在 VS Code 中打开 Web ”以继续开发工作,或者 “另存为代理 ”以在代理场中继续原型制作。
生成和解释代码
使用代码解释器,可以通过在实验环境中启用内联代码执行来扩展模型的功能,不仅局限于文本生成。 激活后,支持的模型可以直接在安全的沙盒环境中编写、运行和调试代码。 此环境非常适合用于执行计算、数据转换、绘制可视化效果或验证逻辑。
要使用已部署模型的测试场景中的代码解释器,请按照以下步骤执行:
展开已部署模型实验环境中的“工具”部分。
小窍门
当您使用比较模式对模型进行并行评估时,工具部分在试验区不可见。 首先,必须关闭用于比较的其他模型,然后才能看到包含已部署模型的工具和其他选项的详细操场。
选择 “添加>代码解释器”,并为代码解释器附加代码文件。
使用沙盒来提问、解释或简化你的代码。 例如,“如何提高附加代码文件的效率?”
在模型场中试验时要验证的内容
使用模型沙盒来计划生产工作负荷时,请浏览并验证以下属性:
提示工程
- 哪种系统提示结构为用例生成最佳输出质量?
- 很少的示例如何影响响应一致性和准确性?
参数敏感度
- 温度、top_p和max_tokens的变化如何影响响应质量?
- 延迟和成本要求的最佳配置是什么?
工具集成
- Web 搜索基础是否提高了您领域的事实准确性?
- 代码解释器如何处理特定数据转换需求?
安全配置
- 在允许合法用例的同时,防护措施是否会阻止对抗性提示?
- 哪些内容安全阈值最适合生产要求?
模型比较
- 哪个模型为用例提供最佳的性价比?
- 可比较模型的延迟和令牌使用差异是什么?
代码导出就绪情况
- 生成的代码示例是否在本地环境中正常运行?
- API 模式是否与现有代码库兼容?
视频游乐场
视频场(预览版)是用于探索、优化和验证生成视频工作流的快速迭代环境。 它专为需要以精确、可控和快速的方式从创意变为原型的开发人员设计。 该操场提供了一个低摩擦接口,用于测试提示结构、评估运动精准度、跨帧评估模型一致性,以及跨模型比较输出,而无需编写模板代码或浪费计算周期。
注释
视频操场是 Foundry 中模型操场和智能体操场的一种。 当你使用操场来试验像 Sora-2 这样的视频模型时,Foundry 会打开视频操场。
所有模型终结点都与 Azure AI Content Safety 集成。 因此,视频游乐场会在有害和不安全的图像显示之前进行筛选。 如果内容审查策略标记文本提示或视频生成,则会收到警告通知。
可以将视频操场与 Azure OpenAI Sora-2 模型配合使用。
按照以下步骤使用视频游乐场:
注意
由于数据隐私,生成的视频将保留 24 小时。 将视频下载到本地计算机以延长保留期。
- 从右上角导航中选择“ 生成 ”。
- 从左窗格中选择 “模型 ”。
- 从已部署的模型列表中选择视频生成模型,例如 sora-2 。 如果还没有部署,请从页面右上角选择 “部署基本模型 ”并部署模型
sora-2。 - 输入文本提示。 对于支持图像到视频生成的模型,请将图像附件上传到提示栏。
- 调整生成控件(如纵横比和持续时间),以了解模型响应能力和约束。
- 在网格视图中目视观察提示调整或参数更改后的输出结果。
- 选择查看代码以访问多语言代码示例,用于生产集成。
在视频游乐场中进行试验时需要验证的内容
使用视频沙盘来规划您的制作工作负载时,请浏览并验证以下属性:
提示到运动的转换
- 视频模型是否以符合逻辑和时间顺序的方式理解你的提示?
- 动作是否与描述的行动或场景一致?
帧一致性
- 字符、对象和样式是否在帧之间保持一致?
- 是否存在视觉伪影、抖动或不自然的过渡?
场景控件
- 如何控制场景构图、主体表现或相机角度?
- 是否可以指导场景转换或背景环境?
长度和计时
- 不同的提示结构如何影响视频长度和节奏?
- 视频感觉太快、太慢还是太短?
多模式输入集成
- 提供引用图像、姿势数据或音频输入时会发生什么情况?
- 是否可以生成与给定画外音口型同步的视频?
处理后需求
- 需要编辑工具之前,可以期望哪种级别的原始保真度?
- 在用于正式发布之前,是否需要对视频进行提高分辨率、稳定处理或润色?
延迟和性能
- 为不同的提示类型或分辨率生成视频需要多长时间?
- 生成 5 秒与 15 秒剪辑的成本性能权衡是什么?
图像操场
图像操场非常适合那些构建图像生成流程的开发人员。 此实验平台是一个功能齐全的受控环境,旨在开展高保真试验,并专为特定模型的 API 生成和编辑图像而设计。
注释
Foundry 中的图像游乐场是模型游乐场和代理游乐场的模式之一。 使用试验场进行图像生成模型实验时,Foundry 会打开图片实验场。 例如,对于 gpt-image-1,你会看到图像操场。
可以将图像操场用于以下模型:
- 来自 Azure OpenAI 的 gpt-image-1。
- 稳定扩散 3.5 大型、稳定图像核心、稳定图像超极 来自 Stability AI。
- 来自黑森林实验室的 FLUX.1-Kontext-pro 和 FLUX-1.1-pro。
按照以下步骤使用图像操场:
- 从右上角导航中选择“ 生成 ”。
- 从左窗格中选择 “模型 ”。
- 从已部署的模型列表中选择映像生成模型,例如 gpt-image-1 。 如果还没有部署,请从页面右上角选择 “部署基本模型 ”并部署模型
gpt-image-1。 - 输入文本提示。 对于支持图像到图像生成的模型,请将图像附件上传到提示栏。
- 调整生成控件,例如变体数和纵横比,以了解模型响应能力和约束。
- 在网格视图中目视观察提示调整或参数更改后的输出结果。
- 使用图像修复转换图像的各个部分。 带文本转换的图像修复功能可用于 gpt-image-1。 使用文本提示指定更改。
- 选择查看代码以访问多语言代码示例,用于生产集成。
在图像操场中进行试验时要验证的内容
通过使用图像沙盒,可以在规划生产工作负载时探索和验证以下方面:
提示有效性
- 此提示为企业用例生成哪种类型的视觉输出?
- 我的语言可以有多具体或抽象,从而取得好的结果?
- 模型是否准确理解“超现实主义”或“网络朋克”等样式引用?
风格一致性
- 如何在多个图像中保持相同的风格、样式或主题?
- 是否可以使用最小偏移循环访问同一基本提示的变体?
参数优化
- 更改模型参数(如引导尺度、种子、步数等)有什么影响?
- 如何平衡创造力与提示保真度?
模型比较
- 结果在模型之间有何差异,例如 SDXL 与 DALL·E?
- 哪个模型在处理现实人脸与艺术合成时表现更好?
合成控件
- 如果使用空间约束(如边界框或修补蒙版),将会发生什么情况?
- 能否引导模型走向特定布局或焦点?
输入变体
- 提示措辞或结构中的细微变化如何影响结果?
- 提示对称性、特定相机角度或情感的最佳方法是什么?
集成就绪情况
- 此图像是否满足产品 UI 的约束,包括纵横比、分辨率和内容安全?
- 输出是否符合品牌准则或客户期望?
故障排除
| 問题 | 决议 |
|---|---|
| 生成过程中内容安全警告 | 优化提示以避免标记的内容。 查看 Azure AI Content Safety 策略。 |
| 部署列表中没有模型 | 检查 Foundry 资源区域的 模型区域可用性 。 |
| 超出配额错误 | 通过 Azure 门户查看您的订阅配额,并提交增加请求。 |
| 比较模式不显示 “工具” 部分 | 首先关闭比较模型。 工具仅在单模型操场视图中可用。 |
| 视频生成的保留时间为有限期 | 视频保留 24 小时。 将视频下载到本地计算机以延长保留期。 |