共用方式為


概念:Azure Databricks 上的生成式 AI

生成式AI應用程式是一種利用生成式AI模型(如大型語言模型、影像生成模型及文字轉語音模型)來產生新輸出、自動化複雜任務,或根據使用者輸入進行智慧互動的應用程式。

生成式AI應用程式可以由簡單呼叫大型語言模型或其他生成式AI模型驅動,或由複雜的AI代理驅動。 閱讀更多關於 複雜度層級的資訊。

代理、工具、評估、模型及生成式AI應用程式的其他面向,都可以用你的專有資料進行客製化。 這種以數據為基礎的客製化,帶來 數據智慧,讓你超越一般 AI 模型所提供的一般智慧。

生成式人工智慧應用

面向使用者的生成式AI應用程式可以有多種形式,例如:

在生成式人工智慧應用上的成功通常需要兩組技能:應用程式開發與人工智慧評估。 生成式AI應用程式開發與開發非AI應用程式相似,需要依應用類型而定的軟體技能。 然而,生成式AI應用的評估需要專門的工具與技術,以應對生成式AI的複雜性與開放式回應。

想了解如何在 Azure Databricks 上打造產業專屬的生成式人工智慧應用程式,請參見:

生成式人工智慧評估

生成式AI模型、代理與應用程式通常具有複雜且開放式的行為。 使用者可以輸入任何查詢。 AI 代理可以在執行過程中收集文字、圖片等資料。 輸出可以是任意的文字、圖片或其他媒介,且可能有許多「好」的答案。

這些複雜性使得評估生成式人工智慧變得困難。 適當的評估需要:

  • 利用 AI 進行自動化評估
  • 專家與使用者的人工回饋,以收集實地資訊並校準自動評估
  • 深入解析複雜的代理程式以理解和除錯其行為

Azure Databricks 管理的 MLflow 及相關工具為生成式 AI 評估奠定基礎:

Agents

代理人或代理人系統是一種 由人工智慧驅動的系統,能夠自主感知、決策並在環境中行動以達成目標。 與只有在被提示時才產生輸出的獨立生成式人工智慧模型不同,代理系統具有一定程度的 自主性。 現代 AI 代理將生成式 AI 模型作為系統的「大腦」,該系統:

  1. 接收來自另一個代理程式的使用者要求或訊息。
  2. 如何繼續的原因:要擷取哪些數據、要套用哪些邏輯、要呼叫哪些工具,或是否要向使用者要求更多輸入。
  3. 執行計劃,並可能呼叫多個工具或委派給子代理程式。
  4. 傳回答案或提示用戶進行其他釐清。

透過橋接 一般智慧 (生成式AI模型的預訓練能力)與 資料智慧 (專屬企業的專業知識與API),代理系統能實現高影響力的企業應用場景,如進階客服流程、資料豐富的分析機器人,以及多代理協調複雜營運任務。

從簡單的生成式人工智慧模型到複雜的代理,存在一個連續體。 欲了解更多,請參閱代理系統設計模式。

Azure Databricks 提供多種建置代理選項,從完全導向到完全客製化:

  • Agent Bricks 提供導引式代理建構器,適用於知識助理與資訊擷取等關鍵應用。
  • AI Playground 提供一個用來原型設計工具呼叫代理的介面,並可匯出產生的代理程式碼。
  • Agent Framework 允許你使用自訂程式碼或第三方代理創作函式庫來建置並部署代理程式。

工具

AI 代理可以呼叫工具來收集資訊或執行行動。 工具是大型語言模型(LLM)可呼叫的單一互動函式,以完成明確定義的任務。 AI 模型通常會為每個工具呼叫產生參數,而此工具提供直接的輸入輸出互動。

常見的工具類別包括:

  • 擷取或分析數據的工具
    • 意檢索:查詢向量索引以尋找相關文字或其他非結構化資料。
    • 結構化檢索:執行 SQL 查詢或使用 API 來擷取結構化資訊。
    • 網路搜尋工具:搜尋網路或內部網路語料庫。
    • 經典機器學習模型:運用機器學習模型進行分類、迴歸或其他預測。
    • 生成式AI模型:產生專門輸出,如程式碼或影像。
  • 修改外部系統狀態的工具
    • API 呼叫:呼叫 CRM 端點、內部服務或其他第三方整合。
    • 電子郵件或訊息應用程式整合:發佈訊息或發送通知。
  • 執行邏輯或執行特定工作的工具
    • 程式碼執行:在沙盒中執行使用者提供或大型語言模型生成的程式碼。

工具可以內建於代理邏輯中,或透過標準化介面如 MCP 存取。

工具與代理人:

  • 工具執行單一且明確定義的操作。 代理人可以執行更開放式的任務。
  • 工具通常是無狀態的,且不會在每次調用後持續維持上下文。 代理程式在反覆解決任務時維持著狀態。

工具錯誤處理與安全性:

由於每個工具呼叫都是外部操作,例如API呼叫,系統應能優雅地處理失敗。 逾時、錯誤的回應或無效輸入不應導致代理本身完全失敗。 在生產環境中,限制允許的工具呼叫數量,若工具呼叫失敗時有備援機制,並套用護欄確保代理系統不會重複相同的失敗動作。

了解更多關於 Databricks 中的 AI 工具:

生成式AI模型與大型語言模型

大型語言模型(LLMs)是訓練於龐大文本資料集的人工智慧模型,能夠理解、生成並推理人類語言。 LLM透過預測並根據輸入提示產生具上下文相關的文字,驅動聊天機器人、程式碼助理及內容生成工具等應用。

更廣泛地說,生成式AI模型或基礎模型會以大量文字、影像、影片、音訊或其他資料訓練,以學習文字以外的模式。 多模態模型學習如何結合人類語言與影像、音訊及其他媒體。 LLMs 是一種生成式人工智慧(GenAI)或基礎模型,儘管這些術語常被寬鬆且互換使用。

生成式AI模型提供生成式AI代理與應用程式背後的智慧。 簡單的應用程式通常是用單一模型搭配提示工程來打造。

了解如何在 Azure Databricks 上使用生成式 AI 模型:

提示工程

生成式AI模型通常會接收提示或指令,告訴模型如何處理使用者輸入。 提示可以高度客製化,包含詳細步驟、專業知識、數據及其他資訊。

Azure Databricks 提供靈活的提示工程方式。 例如:

  • Agent Bricks 根據你的數據和回饋,在幕後自動化提示設計。

微調模型

生成式AI模型也可以透過微調來客製化,這會利用你的自訂資料,針對特定領域或應用程式進行客製化。

Azure Databricks 提供靈活的方式來微調模型。 例如:

什麼是生成式人工智慧平台?

生成式人工智慧需要結合數據與人工智慧的平台。 對開發者與管理員而言,生成式AI的關鍵元件必須在一個簡單統一的平台上連結並治理。

關鍵組件包括:

  • 人工智慧資產,如模型、代理和應用程式
  • 資料資產如檔案、資料表、處理管線、向量索引及特徵儲存
  • 人工智慧的部署,例如用於模型和代理的端點
  • 用於建構與部署 AI 與資料資產的工具

主要治理能力包括:

另請參閱 Mosaic AI 的生成式 AI(GenAI)能力Databricks 架構

瞭解詳情