通过


你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

从 GitHub 模型升级到 Microsoft Foundry 模型

本文介绍如何从 GitHub 模型开始开发生成 AI 应用程序,然后使用 Microsoft Foundry 模型部署 Foundry Tools 资源来升级体验。

当你想在开发生成 AI 应用程序时免费查找和试验 AI 模型时,GitHub 模型非常有用。 准备好将应用程序引入生产环境时,请在 Azure 订阅中部署 Foundry Tools 资源并开始使用 Foundry 模型来升级体验。 不需要更改代码中的其他任何内容。

GitHub 模型的 playground 和免费 API 使用受限于每分钟请求数、每天请求数、每个请求的令牌数和并发请求数。 如果受到速率限制,则需要等待命中的速率限制重置,然后才能发出更多请求。

先决条件

您需要:

升级到 Foundry 模型

玩转空间和免费 API 使用的速率限制帮助你试验模型并开发 AI 应用程序。 准备好将应用程序引入生产环境时,请使用付费 Azure 帐户中的密钥和终结点。 不需要更改代码中的其他任何内容。

注释

GitHub 模型是免费的,速率限制。 升级到 Foundry 模型后,会根据所选 部署类型 向 Azure 订阅计费使用情况。

若要获取密钥和终结点,请执行以下步骤:

  1. 转到 GitHub 模型 并选择一个模型以访问其演示页面。 本文使用 Mistral Medium 3 (25.05)。

  2. 输入一些提示或使用一些建议的提示与模型在实验环境中进行交互。

  3. 在操控台中选择 使用此模型。 此操作将打开一个窗口,“开始在代码库中使用模型”。

  4. 在“配置身份验证”步骤中,从“Azure AI”部分选择“ 获取Microsoft Foundry 密钥 ”。

    一张显示如何从 GitHub 模型沙盒获取 Azure AI 生产密钥的屏幕截图。

  5. 如果已登录到 Azure 帐户,请跳过此步骤。 但是,如果没有 Azure 帐户或未登录到帐户,请执行以下步骤:

    1. 如果没有 Azure 帐户,请选择“ 创建我的帐户 ”,然后按照步骤创建一个帐户。

    2. 或者,如果有 Azure 帐户,请选择 “重新登录”。 如果现有帐户是免费帐户,则首先必须升级到标准计划。

    3. 返回模型的操控界面,然后再次选择获取Microsoft Foundry密钥

    4. 登录 Azure 帐户。

  6. 你被带到 Foundry > GitHub ,并登陆 Foundry 项目中的主页。

    小窍门

    如果登录 Foundry (经典) 体验,请切换右上角导航中的 New Foundry 切换器以切换到新的 Foundry 体验。

  7. 按照 “部署模型 ”中的步骤部署所选模型,在 Playground 中测试模型,并使用代码推断已部署的模型。

  8. 通过在 Playground 中发送测试提示来验证部署是否正常工作。 如果收到响应,则模型已准备好通过代码使用。

重要

与已配置所有模型的 GitHub 模型不同,Foundry Tools 资源允许你控制终结点和配置中可用的模型。 在 model 参数中指示模型之前,请添加你计划使用的任意数量的模型。 了解如何向资源添加更多模型

探索其他功能

Foundry Models 支持 GitHub 模型中不可用的功能:

  • 模型目录 - 从 Azure、合作伙伴和开源社区浏览、比较和评估模型。
  • 无密钥身份验证 - 使用 Microsoft Entra ID 进行基于令牌的身份验证,而无需管理 API 密钥。
  • 内容筛选 - 为部署配置内容安全筛选器。
  • 速率限制 - 为资源中的特定模型设置自定义速率限制。
  • 部署类型 - 从多个部署 SKU 中进行选择,例如按令牌付费、预配和批处理。

排查常见问题

問题 决议
模型在你的区域中不可用 在其 模型目录页上 检查模型的区域可用性,并选择受支持的区域。
密钥交换后的身份验证错误 验证是否已从 Foundry 门户复制正确的密钥。 选择 “项目设置>密钥”和“终结点 ”以查看密钥。
升级后的速率限制错误 Foundry 模型速率限制取决于 部署类型。 纵向扩展或选择更高的吞吐量部署。