Azure Databricks 上的生成式 AI 和大型语言模型 (LLM)

本文概述了 Databricks 上的生成式 AI,并包含示例笔记本和演示的链接。

什么是生成式 AI?

生成式 AI 是一种人工智能,侧重于计算机使用模型创建图像、文本、代码和综合数据等内容的能力。

生成式 AI 应用程序基于大型语言模型 (LLM) 和基础模型来构建。

  • LLM 是深度学习模型,使用和训练大规模数据集,从而在语言处理任务中脱颖而出。 它们基于其训练数据创建模仿自然语言的新的文本组合。
  • 基础模型是预先训练的大型 ML 模型,目的是对其进行微调,以适应更具体的语言理解和生成任务。 这些模型用于识别输入数据中的模式。

这些模型完成学习过程后,将在出现提示时共同生成统计上可能的输出,并可用于完成各种任务,包括:

  • 基于现有图像生成图像,或利用一幅图像的风格来修改或创建新图像。
  • 语音任务,如听录、翻译、问答生成以及文本意向或含义的解释。

重要

虽然许多 LLM 或其他生成式 AI 模型具有安全措施,但它们仍然可能生成有害或不准确的信息。

生成式 AI 具有以下设计模式:

  • 提示工程:制作专门的提示来引导 LLM 的行为
  • 检索增强生成 (RAG):将 LLM 与外部知识检索相结合
  • 微调:调整预训练的 LLM 以适应特定的域数据集
  • 预训练:从头开始训练 LLM

在 Azure Databricks 上开发生成式 AI 和 LLM

Azure Databricks 将 AI 生命周期从数据收集和准备,到模型开发和 LLMOps,再到服务与监视统一起来。 以下功能经过专门优化,以促进生成式 AI 应用程序的开发:

其他资源