在 Databricks 上生成 Gen AI 应用简介
Mosaic AI 提供了全面的平台,用于生成、部署和管理 GenAI 应用程序。 本文指导你完成在 Databricks 上开发 GenAI 应用程序所涉及的基本组件和过程。
部署和查询生成式 AI 模型
对于简单的用例,可以直接提供和查询生成式 AI 模型,包括高质量的开放源代码模型以及 LLM 提供程序(如 OpenAI 和 Anthropic)的第三方模型。
Mosaic AI 模型服务支持使用以下功能来提供和查询生成式 AI 模型:
- 基础模型 API。 此功能使最先进的开放模型和经过微调的模型变体可供你的模型服务终结点使用。 这些模型是支持优化推理的特选基础模型体系结构。 基本模型(如 DBRX 指令、Meta-Llama-3.1-70B-Instruct、GTE-Large 和 Mistral-7B)可用于立即用于按令牌付费定价,以及需要性能保证的工作负载(如微调模型变体),可以使用预配的吞吐量进行部署。
- 外部模型。 这些是在 Databricks 外部托管的生成式 AI 模型。 可以集中管理为外部模型提供服务的终结点,客户可以为其建立速率限制和访问控制。 示例包括 OpenAI 的 GPT-4、Anthropic 的 Claude 等基础模型。
请参阅创建生成式 AI 模型服务终结点。
Mosaic AI 代理框架
Mosaic AI 代理框架包括 Databricks 上的一组工具,这些工具旨在帮助开发人员构建、部署和评估生产质量代理,例如检索增强生成 (RAG) 应用程序。
它与 LangChain 和 LlamaIndex 等第三方框架兼容,允许你使用首选框架进行开发,同时利用 Databricks 的托管 Unity Catalog、代理评估框架和其他平台优势。
使用以下功能快速迭代代理开发: