你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
模型目录中的 Microsoft Foundry 模型分为两大类,即 由 Azure 销售的 Foundry 模型 和 来自合作伙伴和社区的 Foundry 模型。 本文列出了来自合作伙伴和社区的 Foundry 模型选择,以及其功能、部署类型和可用性区域,不包括已弃用和停用的模型。 大多数 Foundry 模型提供商都是受信任的第三方组织、合作伙伴、研究实验室和社区参与者。
重要
未由Azure销售的合作伙伴和社区的模型属于“产品条款”下的非Microsoft产品。
有关Azure销售的 Foundry 模型列表,请参阅Azure销售的 Foundry 模型,有关 Foundry 代理服务支持的 Foundry 模型列表,请参阅代理服务支持的模型。
Foundry 模型支持一个 Foundry 资源的多个 部署类型 。 模型目录中的某些模型需要由 Foundry 中心托管的基于中心的项目进行部署。 在目录中选择这些模型会在 Foundry(经典版)门户界面中打开它们。
先决条件
一个 Azure 订阅。 如果没有帐户,请创建 一个免费帐户。
重要
以下Azure订阅不能用于在市场中购买软件即服务(SaaS)产品/服务:学生、Visual Studio企业版或免费额度。 有关购买 SaaS 产品/服务的详细信息,请参阅 SaaS 购买体验。
订阅合作伙伴和社区提供的模型所需的权限
合作伙伴和社区提供的 Foundry 模型可以用于部署(例如 Cohere 模型),并且这些部署需要使用 Azure 市场。 模型提供程序定义许可条款,并设置其模型使用Azure 市场的价格。
部署第三方模型时,请确保帐户中具有以下权限:
- 关于Azure订阅:
Microsoft.MarketplaceOrdering/agreements/offers/plans/readMicrosoft.MarketplaceOrdering/agreements/offers/plans/sign/actionMicrosoft.MarketplaceOrdering/offerTypes/publishers/offers/plans/agreements/readMicrosoft.Marketplace/offerTypes/publishers/offers/plans/agreements/readMicrosoft.SaaS/register/action
- 在资源组中创建和使用 SaaS 资源:
Microsoft.SaaS/resources/readMicrosoft.SaaS/resources/write
Owner 和 Contributor Azure 订阅上的内置角色包括这些权限。 如果没有所需的权限,请让订阅管理员分配 参与者 角色,或 创建自定义角色 ,其中包括列出的操作。
若要验证权限,请转到 Azure 门户,打开订阅,选择 Access 控件 (IAM)>Check access,然后查看分配的角色。
提示
Microsoft.SaaS/register/action 是订阅上的 SaaS 资源提供程序的一次性注册。 注册后,无需在每次部署时重复注册。
国家/地区可用性
仅当你的 Azure 订阅隶属于某个计费帐户,且该计费帐户所在的国家/地区提供此模型产品时,你才能按即用即付计费方式访问合作伙伴和社区提供的模型。 可用性因模型供应商和模型 SKU 而异。 有关详细信息,请参阅 模型的区域可用性。
Anthropic
Anthropic的旗舰产品是 Claude,这是一种前沿 AI 模型,由领先的企业和全球数百万用户信任,用于编码、代理、财务分析、研究和办公室任务等复杂任务。 Claude 提供卓越的性能,同时保持较高的安全标准。
有关 Claude 模型的概述,请参阅 Microsoft Foundry 中的 Claude 模型(预览版),若要在 Foundry 中使用它们,请参阅在 Microsoft Foundry 中部署和使用 Claude 模型。
注意
克劳德神话 5 和 克劳德神话预览 版仅作为 封闭式研究预览版提供。 是否授予模型访问权限完全由 Anthropic 自行决定,且优先用于防御性网络安全用途。 有关负责任的使用指南,请参阅 Claude Mythos 预览版系统卡 和 Claude Mythos 5 系统卡 。
订阅类型和区域支持
若要在 Microsoft Foundry 中使用 Claude 模型,必须拥有付费的 Azure 订阅,并且在 Anthropic 提供模型购买服务的国家或地区设有账单账户。 有关常见订阅相关错误的列表,请参阅 常见错误消息和解决方案。 当前不支持以下订阅类型:
- 位于韩国的企业帐户
- 云解决方案提供商订阅
- 不具备活跃“即付即用”计费方式的 Azure 订阅(例如,学生、免费试用版或基于启动信用额度的帐户)
- 仅使用Azure额度的赞助订阅。 注意:如果您有一个绑定信用卡的账户,则将从信用卡中扣款,而不是使用 Azure 额度。
有关支持区域的列表,请参阅 支持的地理位置。 请注意,Anthropic的“支持区域政策”可能对您所在地区的可用性产生影响,请查看受支持区域以了解详细信息。
| 模型 | 类型 | 能力 |
|---|---|---|
claude-mythos-5 封闭研究预览版 |
消息 |
-
输入: 文本、图像和代码 - 输出: 文本、图像和代码(最大令牌 128,000 个) - 上下文窗口: 1,000,000 - 语言: en、、fr、arzh、jako、、es、hi - 工具调用: 是(文件搜索、代码执行等) - 响应格式: 各种格式的文本(例如散文、列表、Markdown 表、JSON、HTML、各种编程语言中的代码) - 关键参数: top_p 必须至少为 0.99。 超过 top_p 此阈值的请求被拒绝,并出现 400 错误。 如果 top_p 省略,则使用默认值 (0.99)。 top_k、、temperaturethinking={"type":"enabled"}、 thinking={"type":"disabled"}和output_format不支持。最小可缓存提示词:512 个令牌。 |
claude-fable-5 预览 |
消息 |
-
输入: 文本、图像和代码 - 输出: 文本、图像和代码(最大令牌 128,000 个) - 上下文窗口: 1,000,000 - 语言: en、、fr、arzh、jako、、es、hi - 工具调用: 是(文件搜索、代码执行等) - 响应格式: 各种格式的文本(例如散文、列表、Markdown 表、JSON、HTML、各种编程语言中的代码) - 关键参数: top_p 必须至少为 0.99。 超过 top_p 此阈值的请求被拒绝,并出现 400 错误。 如果 top_p 省略,则使用默认值 (0.99)。 top_k、、temperaturethinking={"type":"enabled"}、 thinking={"type":"disabled"}和output_format不支持。 |
claude-mythos-preview 封闭研究预览版 |
消息 |
-
输入: 文本、图像和代码 - 输出: 文本、图像和代码(最大令牌 128,000 个) - 上下文窗口: 1,000,000 - 语言: en、、fr、arzh、jako、、es、hi - 工具调用: 是(文件搜索和代码执行) - 响应格式: 各种格式的文本(例如散文、列表、Markdown 表、JSON、HTML、各种编程语言中的代码) - 关键参数: top_p 必须至少为 0.99。 超过 top_p 此阈值的请求被拒绝,并出现 400 错误。 如果 top_p 省略,则使用默认值 (0.99)。 top_k和temperature不受支持。最小可缓存提示词:2048 个令牌。 |
claude-opus-4-8 预览 |
消息 |
-
输入: 文本、图像和代码 - 输出: 文本、图像和代码(最大令牌 128,000 个) - 上下文窗口: 1,000,000 - 语言: en、、fr、arzh、jako、、es、hi - 工具调用: 是(文件搜索和代码执行) - 响应格式: 各种格式的文本(例如散文、列表、Markdown 表、JSON、HTML、各种编程语言中的代码) - 关键参数: top_k、temperature、thinking={"type":"enabled"}不支持。top_p 必须为 0.99。 省略时,将使用默认值 (0.99)。 |
claude-opus-4-7 预览 |
消息 |
-
输入: 文本、图像和代码 - 输出: 文本、图像和代码(最大令牌 128,000 个) - 上下文窗口: 1,000,000 - 语言: en、、fr、arzh、jako、、es、hi - 工具调用: 是(文件搜索和代码执行) - 响应格式: 各种格式的文本(例如散文、列表、Markdown 表、JSON、HTML、各种编程语言中的代码) - 关键参数: top_k、temperature、thinking={"type":"enabled"}不支持。top_p 必须为 0.99。 省略时,将使用默认值 (0.99)。 |
claude-opus-4-6 预览 |
消息 |
-
输入: 文本、图像和代码 - 输出: 文本、图像和代码(最大令牌 128,000 个) - 上下文窗口: 1,000,000 - 语言: en、、fr、arzh、jako、、es、hi - 工具调用: 是(文件搜索和代码执行) - 响应格式: 各种格式的文本(例如散文、列表、Markdown 表、JSON、HTML、各种编程语言中的代码) |
claude-opus-4-5 预览 |
消息 |
-
输入: 文本、图像和代码 - 输出: 文本(最大 64,000 个标记) - 上下文窗口: 200,000 - 语言: en、、fr、arzh、jako、、es、hi - 工具调用: 是(文件搜索和代码执行) - 响应格式: 各种格式的文本(例如散文、列表、Markdown 表、JSON、HTML、各种编程语言中的代码) |
claude-opus-4-1 预览 |
消息 |
-
输入: 文本、图像和代码 - 输出: 文本(最大令牌数为32,000) - 上下文窗口: 200,000 - 语言: en、、fr、arzh、jako、、es、hi - 工具调用: 是(文件搜索和代码执行) - 响应格式: 各种格式的文本(例如散文、列表、Markdown 表、JSON、HTML、各种编程语言中的代码) |
claude-sonnet-4-6 预览 |
消息 |
-
输入: 文本、图像和代码 - 输出: 文本、图像和代码(最大令牌 128,000 个) - 上下文窗口: 1,000,000 - 语言: en、、fr、arzh、jako、、es、hi - 工具调用: 是(文件搜索和代码执行) - 响应格式: 各种格式的文本(例如散文、列表、Markdown 表、JSON、HTML、各种编程语言中的代码) |
claude-sonnet-4-5 预览 |
消息 |
-
输入: 文本、图像和代码 - 输出: 文本(最大 64,000 个标记) - 上下文窗口: 200,000 - 语言: en、、fr、arzh、jako、、es、hi - 工具调用: 是(文件搜索和代码执行) - 响应格式: 各种格式的文本(例如散文、列表、Markdown 表、JSON、HTML、各种编程语言中的代码) |
claude-haiku-4-5 预览 |
消息 |
-
输入: 文本和图像 - 输出: 文本(最大 64,000 个标记) - 上下文窗口: 200,000 - 语言: en、、fr、arzh、jako、、es、hi - 工具调用: 是(文件搜索和代码执行) - 响应格式: 各种格式的文本(例如散文、列表、Markdown 表、JSON、HTML、各种编程语言中的代码) |
Cohere
Cohere 系列模型涵盖了针对不同使用场景优化的多种模型,包括对话完成和嵌入。 Cohere 模型针对各种用例进行了优化,包括推理、汇总和问答。
若要在 Foundry 中部署 Cohere 模型,请参阅 Foundry 门户中的 Deploy Microsoft Foundry 模型。
| 模型 | 类型 | 能力 |
|---|---|---|
Cohere-command-r-plus-08-2024 |
chat-completion |
-
输入: 文本(131,072 个标记) - 输出: 文本(4,096 个标记) - 语言: en、、fr、es、it、dept-br、ja、ko和 zh-cnar - 工具调用: 是的 - 响应格式: 文本、JSON |
Cohere-command-r-08-2024 |
chat-completion |
-
输入: 文本(131,072 个标记) - 输出: 文本(4,096 个标记) - 语言: en、、fr、es、it、dept-br、ja、ko和 zh-cnar - 工具调用: 是的 - 响应格式: 文本、JSON |
Cohere-embed-v3-english |
嵌入 |
-
输入: 文本和图像(512 个标记) - 输出: 矢量 (1024 dim.) - 语言: en |
Cohere-embed-v3-multilingual |
嵌入 |
-
输入: 文本(512 个标记) - 输出: 矢量 (1024 dim.) - 语言: en、、fr、es、it、dept-br、ja、ko和 zh-cnar |
Meta
Meta Llama 模型和工具是预先训练和微调的生成 AI 文本和图像推理模型的集合。 元模型的范围包括:
- 小型语言模型 (SLM),例如用于设备端和边缘推理的 1B 和 3B 基础模型及指令模型
- 中型大型语言模型(LLM),如 7B、8B 和 70B 基础模型和指示模型
- Meta Llama 3.1-405B Instruct 等高性能模型用于合成数据生成和数据蒸馏的用例。
若要在 Foundry 中部署 Meta Llama 模型,请参阅 Foundry 门户中的 Deploy Microsoft Foundry 模型。
| 模型 | 类型 | 能力 |
|---|---|---|
Llama-3.2-11B-Vision-Instruct |
chat-completion |
-
输入: 文本和图像(128,000 个标记) - 输出: 文本(8,192 个标记) - 语言: en - 工具调用: 不 - 响应格式: 文本 |
Llama-3.2-90B-Vision-Instruct |
chat-completion |
-
输入: 文本和图像(128,000 个标记) - 输出: 文本(8,192 个标记) - 语言: en - 工具调用: 不 - 响应格式: 文本 |
Meta-Llama-3.1-405B-Instruct |
chat-completion |
-
输入: 文本(131,072 个标记) - 输出: 文本(8,192 个标记) - 语言: en、、de、fr、itpt、hi、和 esth - 工具调用: 不 - 响应格式: 文本 |
Meta-Llama-3.1-8B-Instruct |
chat-completion |
-
输入: 文本(131,072 个标记) - 输出: 文本(8,192 个标记) - 语言: en、、de、fr、itpt、hi、和 esth - 工具调用: 不 - 响应格式: 文本 |
Llama-4-Scout-17B-16E-Instruct |
chat-completion |
-
输入: 文本和图像(128,000 个标记) - 输出: 文本(8,192 个标记) - 语言: en - 工具调用: 不 - 响应格式: 文本 |
Microsoft
Microsoft模型包括各种模型组,例如 MAI 模型、Phi 模型、医疗保健 AI 模型等。
若要在 Foundry 中部署Microsoft模型,请参阅 Foundry 门户中的 Deploy Microsoft Foundry 模型。
| 模型 | 类型 | 能力 |
|---|---|---|
Phi-4-mini-instruct |
chat-completion |
-
输入: 文本(131,072 个标记) - 输出: 文本(4,096 个标记) - 语言: ar、zh、cs、da、nl、en、fi、fr、de、he、hu、it、ja、ko、no、pl、pt、ru、es、sv、th、tr和uk - 工具调用: 不 - 响应格式: 文本 |
Phi-4-multimodal-instruct |
chat-completion |
-
输入: 文本、图像和音频(131,072 个标记) - 输出: 文本(4,096 个标记) - 语言: ar、zh、cs、da、nl、en、fi、fr、de、he、hu、it、ja、ko、no、pl、pt、ru、es、sv、th、tr和uk - 工具调用: 不 - 响应格式: 文本 |
Phi-4 |
chat-completion |
-
输入: 文本(16,384 个标记) - 输出: 文本(16,384 个标记) - 语言: en, ar, bn, cs, da, de, el, es, fa, fi, fr, gu, ha, he, hi, hu, id, it, ja, jv, kn, ko, ml, mr, nl, no, or, pa, pl, ps, pt, ro, ru, sv, sw, ta, te, th, tl, tr, uk, ur, vi, yo, 和 zh - 工具调用: 不 - 响应格式: 文本 |
Phi-4-reasoning |
使用推理内容的聊天补全 |
-
输入: 文本(32,768 个标记) - 输出: 文本(32,768 个标记) - 语言: en - 工具调用: 不 - 响应格式: 文本 |
Phi-4-mini-reasoning |
使用推理内容的聊天补全 |
-
输入: 文本(128,000 个标记) - 输出: 文本(128,000 个标记) - 语言: en - 工具调用: 不 - 响应格式: 文本 |
Mistral人工智能
Mistral AI 为代码生成、常规用途聊天和多模式任务(包括 Codestral、Ministral、Mistral Small 和 Mistral Medium)提供了模型。
若要在 Foundry 中部署 Mistral AI 模型,请参阅 Foundry 门户中的 Deploy Microsoft Foundry 模型。
| 模型 | 类型 | 能力 |
|---|---|---|
Codestral-2501 |
chat-completion |
-
输入: 文本(262,144 个标记) - 输出: 文本(4,096 个标记) - 语言: en - 工具调用: 不 - 响应格式: 文本 |
Ministral-3B |
chat-completion |
-
输入: 文本(131,072 个标记) - 输出: 文本(4,096 个标记) - 语言: fr、de、es、it 和 en - 工具调用: 是的 - 响应格式: 文本、JSON |
Mistral-small-2503 |
chat-completion |
-
输入: 文本(32,768 个标记) - 输出: 文本(4,096 个标记) - 语言: fr、de、es、it 和 en - 工具调用: 是的 - 响应格式: 文本、JSON |
Mistral-medium-2505 |
chat-completion |
-
输入: 文本(128,000 个标记),图像 - 输出: 文本(128,000 个标记) - 工具调用: 不 - 响应格式: 文本、JSON |
mistralai-Mistral-7B-Instruct-v01
1 |
chat-completion |
-
输入: 文本 - 输出: 文本 - 语言: en - 响应格式: 文本 |
mistralai-Mistral-7B-Instruct-v0-2
1 |
chat-completion |
-
输入: 文本 - 输出: 文本 - 语言: en - 响应格式: 文本 |
mistralai-Mixtral-8x7B-Instruct-v01
1 |
chat-completion |
-
输入: 文本 - 输出: 文本 - 语言: en - 响应格式: 文本 |
mistralai-Mixtral-8x22B-Instruct-v0-1
1 |
chat-completion |
-
输入: 文本(64,000 个标记) - 输出: 文本(4,096 个标记) - 语言: fr、it、de、es、en - 响应格式: 文本 |
1 这些模型需要基于中心的项目进行部署。 在模型目录中选择它们会在 Foundry(经典版)门户体验中打开它们。
Nixtla
Nixtla 的 TimeGEN-1 是用于时序数据的生成预训练预测和异常检测模型。 TimeGEN-1 在不进行训练的情况下,仅使用历史值和外生协变量作为输入,为新的时序生成准确的预测。
若要在 Foundry 中部署 TimeGEN-1,请参阅 Foundry 门户中的 Deploy Microsoft Foundry 模型。
若要执行推理,TimeGEN-1 要求使用 Nixtla 的自定义推理 API。
| 模型 | 类型 | 能力 | 推理 API |
|---|---|---|---|
TimeGEN-1
1 |
预测 |
-
输入: 时序数据作为 JSON 或数据帧(支持多变量输入) - 输出: 时序数据作为 JSON - 工具调用: 不 - 响应格式: Json |
预测客户端与 Nixtla 的 API 交互 |
1 此模型需要基于中心的项目进行部署。 在模型目录中选择该模型会在 Foundry(经典版)门户体验中打开它。
有关 Nixtla 模型的定价的更多详细信息,请参阅 Nixtla。
NTT 数据
tsuzumi 是自动回归语言优化的转换器。 优化版本使用监督式微调 (SFT)。 tsuzumi 高效处理日语和英语两种语言。
若要在 Foundry 中部署 tsuzumi-7b,请参阅 Foundry 门户中的 Deploy Microsoft Foundry 模型。
| 模型 | 类型 | 能力 |
|---|---|---|
tsuzumi-7b
1 |
chat-completion |
-
输入: 文本(8,192 个标记) - 输出: 文本(8,192 个标记) - 语言: en 和 jp - 工具调用: 不 - 响应格式: 文本 |
1 此模型需要基于中心的项目进行部署。 在模型目录中选择该模型会在 Foundry(经典版)门户体验中打开它。
稳定性 AI
Stability AI 的图像生成模型集合包括 Stable Image Core、Stable Image Ultra 和 Stable Diffusion 3.5 Large。 稳定扩散 3.5 大型接受图像和文本输入。
若要在 Foundry 中部署稳定性 AI 模型,请参阅 Foundry 门户中的 Deploy Microsoft Foundry 模型。
| 模型 | 类型 | 能力 |
|---|---|---|
Stable Diffusion 3.5 Large |
图像生成 |
-
输入: 文本和图像(1,000 个令牌和 1 个图像) - 输出: 一个图像 - 工具调用: 不 - 响应格式:图像(PNG 和 JPG) |
Stable Image Core |
图像生成 |
-
输入: 文本(1,000 个词元) - 输出: 一个图像 - 工具调用: 不 - 响应格式: 图像(PNG 和 JPG) |
Stable Image Ultra |
图像生成 |
-
输入: 文本(1,000 个词元) - 输出: 一个图像 - 工具调用: 不 - 响应格式: 图像(PNG 和 JPG) |
故障 排除
使用以下故障排除指南在 Foundry 模型中部署第三方模型时查找并解决错误:
| 错误 | 描述 |
|---|---|
| 此优惠在您的国家/地区不可用 | 模型提供商未在你注册订阅的国家/地区提供特定的模型 SKU。 每个模型提供程序决定哪些国家/地区可用,可用性可能因模型 SKU 而异。 将模型部署到在受支持国家/地区有计费功能的订阅。 请参阅 模型的区域可用性。 |
| 市场购买资格验证失败 | 模型提供程序未使特定模型 SKU 在你的国家/地区可用,或者模型在部署 Foundry 资源的区域中不可用。 请参阅 模型的区域可用性。 |
| 无法创建模型部署 | Azure 市场拒绝了创建模型订阅的请求。 这种拒绝可能由于多种原因而发生,包括频繁订阅模型服务或同时进行多项订阅。 请联系 支持人员 ,并包括订阅 ID。 |
| 不支持 CSP 订阅 | 云解决方案提供商 (CSP) 订阅无法购买第三方模型产品/服务。 考虑使用以第一方消费服务形式提供的模型。 |