本文介绍 Databricks 基础模型 API 支持的最先进的开放模型。
注释
有关这些模型的区域可用性和支持的功能区域,请参阅 马赛克 AI 模型服务支持的基础模型 。
可以使用 Databricks 工作区中提供的按令牌付费终结点向这些模型发送查询请求。 要查看需使用的模型终结点名称,请参阅 基础模型使用 和 按令牌付费支持的模型表。
除了支持按令牌付费模式的模型外,基础模型 API 还提供预配的吞吐量模式。 Databricks 建议为生产工作负荷预配吞吐量。 此模式支持模型体系结构系列(例如 DBRX 模型)的所有模型,包括按令牌付费模式支持的微调和自定义预训练模型。 有关支持的体系结构列表,请参阅 预配的吞吐量基础模型 API。
可以使用 AI Playground与这些支持的模型进行交互。
Alibaba Cloud Qwen3-Next 80B A3B 指令
重要
Qwen3-Next 80B A3B 指令模型在 Beta 版中,仅在 eastus2 地区可用。
- 有关如何启用此模型的指南,请参阅 “管理 Azure Databricks 预览 版”。
- Qwen3-Next 80B A3B Instruct 是根据 Apache 2.0 许可证提供,并遵循 Apache 软件基金会的版权(c)规定,保留所有权利。 客户需负责确保遵守适用的模型许可证。
终结点名称: databricks-qwen3-next-80b-a3b-instruct
Qwen3-Next-80B-A3B-Instruct 是一种高效大型语言模型,针对阿里巴巴云构建和训练的指令跟踪任务进行了优化。 此模型专为处理超长上下文而设计,在多步骤工作流、检索增强生成以及需要高吞吐量确定性输出的企业应用程序中表现出色。
与其他大型语言模型一样,Qwen3-Next 80B A3B 指示输出可能会省略一些事实,偶尔会生成虚假信息。 Databricks 建议在准确性特别重要的情况下使用检索扩充生成(RAG)。
OpenAI GPT OSS 120B
重要
OpenAI GPT OSS 120B 受 Apache 2.0 许可证、版权(c)Apache Software Foundation 保留的所有权利的约束。 客户需负责确保遵守适用的模型许可证。
终结点名称: databricks-gpt-oss-120b
GPT OSS 120B 是一种最先进的推理模型,具有由 OpenAI 构建和训练的思维链和可调整推理工作水平。 它是 OpenAI 的旗舰开放式重量模型,具有 128K 令牌上下文窗口。 该模型是为高质量推理任务构建的。
与其他大型语言模型一样,GPT OSS 120B 输出可能省略一些事实,偶尔会生成虚假信息。 Databricks 建议在准确性特别重要的情况下使用检索扩充生成(RAG)。
OpenAI GPT OSS 20B
重要
OpenAI GPT OSS 20B 受 Apache 2.0 许可证、版权(c)Apache Software Foundation 保留的所有权利的约束。 客户需负责确保遵守适用的模型许可证。
终结点名称: databricks-gpt-oss-20b
GPT OSS 20B 是一种由 OpenAI 构建和训练的最先进的轻型推理模型。 此模型具有一个 128K 令牌上下文窗口,在实时的 copilot 和批处理推理任务中表现优异。
与其他大型语言模型一样,GPT OSS 20B 输出可能会省略一些事实,偶尔会生成虚假信息。 Databricks 建议在准确性特别重要的情况下使用检索扩充生成(RAG)。
Google Gemma 3 12B
重要
请参阅 适用的模型开发人员许可证和条款,以了解 Gemma 3 社区许可证和可接受的使用策略。
终结点名称: databricks-gemma-3-12b
Gemma 3 12B 是 Google 作为 Gemma 3 系列一部分开发的 120 亿参数多模式和视觉语言模型。 Gemma 3 最多具有 128K 令牌上下文,并为超过 140 种语言提供多语言支持。 此模型旨在处理文本和图像输入以及生成文本输出,并针对对话用例、文本生成和图像理解任务(包括问答)进行优化。
与其他大型语言模型一样,Gemma 3 输出可能省略一些事实,偶尔会生成虚假信息。 Databricks 建议在准确性特别重要的情况下使用检索扩充生成(RAG)。
Meta Llama 4 特立独行者
重要
请参阅 适用的模型开发人员许可证和条款,了解 Llama 4 社区许可证和可接受的使用策略。
终结点名称: databricks-llama-4-maverick
Llama 4 Maverick 是由 Meta 构建和训练的最先进的大型语言模型。 这是 Llama 模型系列中第一个采用专家组合架构来优化计算效率的模型。 Llama 4 Maverick 支持多种语言,并针对精确的图像和文本理解用例进行优化。 目前,Databricks 对 Llama 4 Maverick 的支持仅限于文本理解的使用场景。 详细了解 Llama 4 Maverick。
与其他大型语言模型一样,Llama 4 输出可能省略一些事实,偶尔会生成虚假信息。 Databricks 建议在准确性特别重要的情况下使用检索扩充生成(RAG)。
Meta Llama 3.3 70B 指令
重要
从 2024 年 12 月 11 日起,在基础模型 API 按令牌付费终结点中,Meta-Llama-3.3-70B-Instruct 取代了对 Meta-Llama-3.1-70B-Instruct 的支持。
LLama 3.3 社区许可证和可接受的使用策略 ,请参阅适用的 模型开发人员许可证和条款。
终结点名称: databricks-meta-llama-3-3-70b-instruct
Meta-Llama-3.3-70B-Instruct 是一种最先进的大型语言模型,其上下文为 128,000 个令牌,由 Meta 构建和训练。 该模型支持多种语言,并针对对话用例进行优化。 详细了解 Meta Llama 3.3。
与其他大型语言模型类似,Llama-3 的输出可能会省略一些事实,偶尔会生成虚假信息。 Databricks 建议在准确性特别重要的情况下使用检索扩充生成(RAG)。
Meta Llama 3.1 405B 指令
重要
Meta-Llama-3.1-405B-Instruct 将停用,
- 从 2026 年 2 月 15 日开始,按令牌付费的工作负载。
- 从 2026 年 5 月 15 日开始,用于预配置的吞吐量任务。
有关建议的替换模型以及有关如何在弃用期间迁移的指导,请参阅 “停用”模型 。
重要
将此模型与基础模型 API 的配合使用为公共预览版。 如果在使用此模型时遇到终结点故障或稳定错误,请联系 Databricks 帐户团队。
有关 Llama 3.1 社区许可证和可接受使用政策的详细信息,请参阅 适用的模型开发人员许可证和条款 。
终结点名称: databricks-meta-llama-3-1-405b-instruct
Meta-Llama-3.1-405B-Instruct 是最大的公开可用的大型语言模型,由 Meta 构建和训练,由 Azure 机器学习使用 AzureML 模型目录分发。 使用此模型,客户可以解锁新功能,例如高级、多步骤推理和 高质量的综合数据生成。 此模型在质量方面与 GPT-4-Turbo 竞争。
与 Meta-Llama-3.1-70B-Instruct 一样,此模型具有 128,000 个令牌的上下文,并支持十种语言。 它与人类对帮助和安全偏好保持一致,并针对对话用例进行优化。 详细了解 Meta Llama 3.1 模型。
与其他大型语言模型类似,Llama-3.1 的输出可能会省略一些事实,偶尔会生成虚假信息。 Databricks 建议在准确性特别重要的情况下使用检索扩充生成(RAG)。
Meta Llama 3.1 8B 指令
重要
请参阅 适用的模型开发人员许可证和条款,以了解 LLama 3.1 社区许可证和可接受的使用策略。
终结点名称: databricks-meta-llama-3-1-8b-instruct
Meta-Llama-3.1-8B-Instruct 是一种最先进的大型语言模型,其上下文为 128,000 个令牌,由 Meta 构建和训练。 该模型支持多种语言,并针对对话用例进行优化。 详细了解 Meta Llama 3.1。
与其他大型语言模型类似,Llama-3 的输出可能会省略一些事实,偶尔会生成虚假信息。 Databricks 建议在准确性特别重要的情况下使用检索扩充生成(RAG)。
Anthropic Claude 小夜曲 4.5
重要
客户负责确保符合Anthropic的可接受使用政策条款。 另请参阅 Databricks Master 云服务协议。
终结点名称: databricks-claude-sonnet-4-5
Claude Sonnet 4.5 是人类学最先进的混合推理模型。 它提供两种模式:近乎即时的响应和扩展思维,以便基于任务的复杂性进行更深入的推理。 Claude Sonnet 4.5 专用于需要实际吞吐量和高级思维(如面向客户的代理、生产编码工作流和大规模内容生成)的应用程序。
与其他大型语言模型一样,Claude Sonnet 4.5 输出可能省略一些事实,偶尔会生成虚假信息。 Databricks 建议在准确性特别重要的情况下使用检索扩充生成(RAG)。
此终结点由 Databricks Inc. 在 AWS 上托管,并位于 Databricks 的安全边界内。
Anthropic Claude 十四行诗 4
重要
客户负责确保符合Anthropic的可接受使用政策条款。 另请参阅 Databricks Master 云服务协议。
终结点名称: databricks-claude-sonnet-4
Claude Sonnet 4 是一种最先进的混合推理模型,由人类学构建和训练。 此模型提供两种模式:近乎即时的响应和扩展思维,以便基于任务的复杂性进行更深入的推理。 Claude Sonnet 4 针对代码开发、大规模内容分析和代理应用程序开发等各种任务进行了优化。
与其他大型语言模型一样,Claude Sonnet 4 输出可能省略一些事实,偶尔会生成虚假信息。 Databricks 建议在准确性特别重要的情况下使用检索扩充生成(RAG)。
此终结点由 Databricks Inc. 在 AWS 上托管,并位于 Databricks 的安全边界内。
人类科洛德·奥普斯 4.1
重要
客户负责确保符合Anthropic的可接受使用政策条款。 另请参阅 Databricks Master 云服务协议。
终结点名称: databricks-claude-opus-4-1
克劳德·奥普斯 4.1 是一种最先进的混合推理模型,由人类学构建和训练。 这种通用大型语言模型专为企业规模的复杂推理和实际应用程序而设计。 它支持文本和图像输入,其中包含 200K 令牌上下文窗口和 32K 输出令牌功能。 此模型擅长代码生成、研究和内容创建和多步骤代理工作流等任务,无需持续人工干预。
与其他大型语言模型一样,Claude Opus 4.1 输出可能省略一些事实,偶尔会生成虚假信息。 Databricks 建议在准确性特别重要的情况下使用检索扩充生成(RAG)。
此终结点由 Databricks Inc. 在 AWS 上托管,并位于 Databricks 的安全边界内。
Anthropic Claude 3.7《十四行诗》
重要
客户负责确保符合Anthropic的可接受使用政策条款。 另请参阅 Databricks Master 云服务协议。
终结点名称: databricks-claude-3.7-sonnet
Claude 3.7 Sonnet 是一种最先进的混合推理模型,由人类学构建和训练。 它是一个大型语言模型和推理模型,能够根据任务的复杂性快速响应或扩展其推理。 在扩展思维模式下,Claude 3.7 Sonnet 的推理步骤对用户可见。 Claude 3.7 Sonnet 针对各种任务进行了优化,例如代码生成、数学推理和遵循指令。
与其他大型语言模型一样,Claude 3.7 输出可能会省略一些事实,偶尔会生成虚假信息。 Databricks 建议在准确性特别重要的情况下使用检索扩充生成(RAG)。
此终结点由 Databricks Inc. 在 AWS 上托管,并位于 Databricks 的安全边界内。
GTE Large(英语版)
重要
GTE Large(En)根据Apache 2.0 许可证提供,版权所有(c)Apache Software Foundation,保留所有权利。 客户需负责确保遵守适用的模型许可证。
终结点名称: databricks-gte-large-en
通用文本嵌入(GTE) 是一个文本嵌入模型,可以将任何文本映射为一个 1024 维的嵌入向量,并且其嵌入窗口为 8192 个标记。 这些向量可用于 LLM 的向量索引以及检索、分类、问答、聚类分析或语义搜索等任务。 此终结点提供模型的英文版本,不会生成规范化嵌入。
嵌入模型在与大型语言模型(LLM)结合使用以进行检索增强生成(RAG)用例时特别有效。 GTE 可用于查找可在 LLM 上下文中使用的大量文档的相关文本片段。
BGE Large(英语版)
终结点名称: databricks-bge-large-en
BAAI 通用嵌入(BGE) 是一种文本嵌入模型,可以将任何文本映射到 1024 维的嵌入向量,并具有 512 字节的输入窗口。 这些向量可用于 LLM 的向量索引以及检索、分类、问答、聚类分析或语义搜索等任务。 此终结点提供模型的英文版本并生成规范化嵌入。
嵌入模型在与大型语言模型(LLM)结合使用以进行检索增强生成(RAG)用例时特别有效。 BGE 可用于查找可在 LLM 上下文中使用的大量文档的相关文本片段。
在 RAG 应用程序中,可以通过包括指令参数来提高检索系统的性能。 BGE 作者建议尝试使用指令 "Represent this sentence for searching relevant passages:" 以实现查询嵌入,尽管其性能影响取决于具体领域。