適用於:
Databricks SQL
Databricks Runtime
ai_extract() 函數可讓您叫用最先進的生成式 AI 模型,以使用 SQL 從指定文字擷取標籤指定的實體。 此函式會使用 Databricks Foundation Model API 所提供的端點的聊天模型。
需求
重要
目前可能使用的基礎模型會根據 Apache 2.0授權、著作權© Apache Software Foundation 或 LLAMA 3.3社群授權 著作權©中繼平臺公司進行授權。保留所有權利。 客戶應負責確保遵循適用的模型授權。
Databricks 建議檢閱這些授權,以確保符合任何適用的條款。 如果未來模型根據 Databricks 的內部基準檢驗而表現更好,Databricks 可能會變更模型(以及此頁面上提供的適用授權清單)。
- 此函式僅適用於支持 針對批次推斷優化之 AI Functions 的區域工作區。
- 此函數不適用於 Azure Databricks SQL Classic。
- 檢查 Databricks SQL 定價頁面。
- 在 Databricks Runtime 15.1 和更新版本中,Databricks 筆記本中支援執行此函數,包括在 Databricks 工作流程中作為任務執行的筆記本。
- 批次推斷工作負載需要 Databricks Runtime 15.4 ML LTS 以改善效能。
注意
在 Databricks Runtime 15.1 和更新版本中,Databricks 筆記本中支援執行此函數,包括在 Databricks 工作流程中作為任務執行的筆記本。
語法
ai_extract(content, labels)
引數
-
content:一個STRING運算式。 -
labels:ARRAY<STRING>常數。 每個元素都是要擷取的實體類型。
退貨
STRUCT,其中每個欄位都對應至 labels 中指定的實體類型。 每個欄位都包含代表所擷取實體的字串。 如果針對任何一種實體類型發現多個候選項,則只會返回其中一個。
如果 content 是 NULL,結果就是 NULL。
範例
> SELECT ai_extract(
'John Doe lives in New York and works for Acme Corp.',
array('person', 'location', 'organization')
);
{"person": "John Doe", "location": "New York", "organization": "Acme Corp."}
> SELECT ai_extract(
'Send an email to jane.doe@example.com about the meeting at 10am.',
array('email', 'time')
);
{"email": "jane.doe@example.com", "time": "10am"}