Databricks 基础模型 API 支持的模型

本文介绍 Databricks 基础模型 API 支持的最先进的开放模型。

注释

有关这些模型的区域可用性和支持的功能区域,请参阅 马赛克 AI 模型服务支持的基础模型

可以使用 Databricks 工作区中提供的按令牌付费终结点向这些模型发送查询请求。 要查看需使用的模型终结点名称,请参阅 基础模型使用按令牌付费支持的模型表

除了支持按令牌付费模式的模型外,基础模型 API 还提供预配的吞吐量模式。 Databricks 建议为生产工作负荷预配吞吐量。 此模式支持模型体系结构系列(例如 DBRX 模型)的所有模型,包括按令牌付费模式支持的微调和自定义预训练模型。 有关支持的体系结构列表,请参阅 预配的吞吐量基础模型 API

可以使用 AI Playground与这些支持的模型进行交互。

Meta Llama 4 特立独行者

重要

请参阅 适用的模型开发人员许可证和条款,了解 Llama 4 社区许可证和可接受的使用策略。

Llama 4 Maverick 是由 Meta 构建和训练的最先进的大型语言模型。 这是 Llama 模型系列中第一个采用专家组合架构来优化计算效率的模型。 Llama 4 Maverick 支持多种语言,并针对精确的图像和文本理解用例进行优化。 目前,Databricks 对 Llama 4 Maverick 的支持仅限于文本理解的使用场景。 详细了解 Llama 4 Maverick

与其他大型语言模型一样,Llama 4 输出可能省略一些事实,偶尔会生成虚假信息。 Databricks 建议在准确性特别重要的情况下使用检索扩充生成(RAG)。

Meta Llama 3.3 70B 指令

重要

从 2024 年 12 月 11 日起,在基础模型 API 按令牌付费终结点中,Meta-Llama-3.3-70B-Instruct 取代了对 Meta-Llama-3.1-70B-Instruct 的支持。

LLama 3.3 社区许可证和可接受的使用策略 ,请参阅适用的 模型开发人员许可证和条款

Meta-Llama-3.3-70B-Instruct 是一种最先进的大型语言模型,其上下文为 128,000 个令牌,由 Meta 构建和训练。 该模型支持多种语言,并针对对话用例进行优化。 详细了解 Meta Llama 3.3

与其他大型语言模型类似,Llama-3 的输出可能会省略一些事实,偶尔会生成虚假信息。 Databricks 建议在准确性特别重要的情况下使用检索扩充生成(RAG)。

Meta Llama 3.1 405B 指示

重要

将此模型与基础模型 API 的配合使用为公共预览版。 如果在使用此模型时遇到终结点故障或稳定错误,请联系 Databricks 帐户团队。

有关 Llama 3.1 社区许可证和可接受使用政策的详细信息,请参阅 适用的模型开发人员许可证和条款

Meta-Llama-3.1-405B-Instruct 是最大的公开可用的大型语言模型,由 Meta 构建和训练,由 Azure 机器学习使用 AzureML 模型目录分发。 使用此模型,客户可以解锁新功能,例如高级、多步骤推理和 高质量的综合数据生成。 此模型在质量方面与 GPT-4-Turbo 竞争。

与 Meta-Llama-3.1-70B-Instruct 一样,此模型具有 128,000 个令牌的上下文,并支持十种语言。 它与人类对帮助和安全偏好保持一致,并针对对话用例进行优化。 详细了解 Meta Llama 3.1 模型

与其他大型语言模型类似,Llama-3.1 的输出可能会省略一些事实,偶尔会生成虚假信息。 Databricks 建议在准确性特别重要的情况下使用检索扩充生成(RAG)。

Meta Llama 3.1 8B 指令

重要

请参阅 适用的模型开发人员许可证和条款,以了解 LLama 3.1 社区许可证和可接受的使用策略。

Meta-Llama-3.1-8B-Instruct 是一种最先进的大型语言模型,其上下文为 128,000 个令牌,由 Meta 构建和训练。 该模型支持多种语言,并针对对话用例进行优化。 详细了解 Meta Llama 3.1

与其他大型语言模型类似,Llama-3 的输出可能会省略一些事实,偶尔会生成虚假信息。 Databricks 建议在准确性特别重要的情况下使用检索扩充生成(RAG)。

Anthropic Claude 十四行诗 4

重要

客户负责确保符合Anthropic的可接受使用政策条款。 另请参阅 Databricks Master 云服务协议

Claude Sonnet 4 是一种最先进的混合推理模型,由人类学构建和训练。 此模型提供两种模式:近乎即时的响应和扩展思维,以便基于任务的复杂性进行更深入的推理。 Claude Sonnet 4 针对代码开发、大规模内容分析和代理应用程序开发等各种任务进行了优化。

与其他大型语言模型一样,Claude Sonnet 4 输出可能省略一些事实,偶尔会生成虚假信息。 Databricks 建议在准确性特别重要的情况下使用检索扩充生成(RAG)。

此终结点由 Databricks Inc. 在 AWS 上托管,并位于 Databricks 的安全边界内。

人类克劳德·奥普斯 4

重要

客户负责确保符合Anthropic的可接受使用政策条款。 另请参阅 Databricks Master 云服务协议

克劳德·奥普斯 4 是一种最先进的混合推理模型,由人类学构建和训练。 此模型提供两种模式:近乎即时的响应和扩展思维,以便基于任务的复杂性进行更深入的推理。 Claude Opus 4 针对各种任务进行了优化,例如高级代码生成、代理编排、跨来源研究、内容创建和利用上下文保留功能进行汇总。

与其他大型语言模型一样,Claude Opus 4 输出可能会省略一些事实,偶尔会生成虚假信息。 Databricks 建议在准确性特别重要的情况下使用检索扩充生成(RAG)。

此终结点由 Databricks Inc. 在 AWS 上托管,并位于 Databricks 的安全边界内。

Anthropic Claude 3.7 十四行诗

重要

客户负责确保符合Anthropic的可接受使用政策条款。 另请参阅 Databricks Master 云服务协议

Claude 3.7 Sonnet 是一种最先进的混合推理模型,由人类学构建和训练。 它是一个大型语言模型和推理模型,能够根据任务的复杂性快速响应或扩展其推理。 在扩展思维模式下,Claude 3.7 Sonnet 的推理步骤对用户可见。 Claude 3.7 Sonnet 针对各种任务进行了优化,例如代码生成、数学推理和遵循指令。

与其他大型语言模型一样,Claude 3.7 输出可能会省略一些事实,偶尔会生成虚假信息。 Databricks 建议在准确性特别重要的情况下使用检索扩充生成(RAG)。

此终结点由 Databricks Inc. 在 AWS 上托管,并位于 Databricks 的安全边界内。

GTE Large(英语版)

重要

GTE Large(En)根据Apache 2.0 许可证提供,版权所有(c)Apache Software Foundation,保留所有权利。 客户需负责确保遵守适用的模型许可证。

通用文本嵌入(GTE) 是一个文本嵌入模型,可以将任何文本映射为一个 1024 维的嵌入向量,并且其嵌入窗口为 8192 个标记。 这些向量可用于 LLM 的向量索引以及检索、分类、问答、聚类分析或语义搜索等任务。 此终结点提供模型的英文版本,不会生成规范化嵌入。

嵌入模型在与大型语言模型(LLM)结合使用以进行检索增强生成(RAG)用例时特别有效。 GTE 可用于查找可在 LLM 上下文中使用的大量文档的相关文本片段。

BGE Large(英语版)

BAAI 通用嵌入(BGE) 是一种文本嵌入模型,可以将任何文本映射到 1024 维的嵌入向量,并具有 512 字节的输入窗口。 这些向量可用于 LLM 的向量索引以及检索、分类、问答、聚类分析或语义搜索等任务。 此终结点提供模型的英文版本并生成规范化嵌入。

嵌入模型在与大型语言模型(LLM)结合使用以进行检索增强生成(RAG)用例时特别有效。 BGE 可用于查找可在 LLM 上下文中使用的大量文档的相关文本片段。

在 RAG 应用程序中,可以通过包括指令参数来提高检索系统的性能。 BGE 作者建议尝试使用指令 "Represent this sentence for searching relevant passages:" 以实现查询嵌入,尽管其性能影响取决于具体领域。

其他资源