Share via


Azure Databricks の生成 AI と 大規模言語モデル (LLM)

この記事では、Databricks における生成 AI の概要と、ノートブックやデモの例へのリンクを紹介します。

生成 AI とは

生成 AI は、画像、テキスト、コード、合成データなどのコンテンツを作成するためにモデルを使用するコンピューターの機能に焦点を当てた人工知能の一種です。

生成 AI アプリケーションは、大規模言語モデル (LLM) や基盤モデル上に構築されます。

  • LLM は、優れた言語処理タスクを行うために膨大なデータセットを消費してトレーニングを行うディープ ラーニング モデルです。 LLM は、そのトレーニング データに基づいて、自然言語を模倣した新しいテキストの組み合わせを作成します。
  • 基盤モデルは、より具体的な言語理解と生成タスクのために微調整されることを意図して事前にトレーニングされた大規模な機械学習モデルです。 これらのモデルは、入力データのパターンを識別するために利用されます。

これらのモデルは、学習プロセスを完了した後、一緒にプロンプトが表示されたときに統計的に確率の高い出力を生成し、次のようなさまざまなタスクを達成するために採用できます。

  • 既存の画像に基づく画像生成、またはある画像のスタイルを利用して新しい画像を修正または作成します。
  • 文字起こし、翻訳、質問と回答の生成、テキストの意図や意味の解釈などの音声タスク。

重要

多くの LLM やその他の生成型 AI モデルにはセーフガードが用意されていますが、それでも有害、または不正確な情報が生成される可能性があります。

生成 AI には、次の設計パターンがあります。

  • プロンプト エンジニアリング: LLM の動作のガイド専用のプロンプトの作成
  • 検索拡張生成 (RAG): LLM と外部ナレッジの検索の組み合わせ
  • 微調整: ドメインの特定のデータ セットへの事前トレーニング済み LLM の適応
  • 事前トレーニング: LLM のゼロからのトレーニング

Azure Databricks で生成 AI と LLM を開発する

Azure Databricks は、データ収集と準備から、モデル開発と LLMOps、サービス提供と監視に至るまで、AI のライフサイクルを統合します。 次の機能は、特に生成 AI アプリケーションの開発を促進するために最適化されています。

その他のリソース