共用方式為


ai_extract 函式

適用於:check marked yes Databricks SQL

重要

這項功能處於公開預覽狀態

在預覽中,

  • 基礎語言模型可以處理數種語言,不過這些函式會針對英文進行調整。
  • 基礎基礎模型 API 有速率限制,請參閱 基礎模型 API 限制 來更新這些限制。

ai_extract() 式可讓您叫用最先進的產生 AI 模型,以使用 SQL 從指定文字擷取標籤所指定的實體。 此函式會使用 Databricks Foundation Model API 所提供的端點的聊天模型。

需求

重要

目前可能使用的基礎模型會根據 Apache 2.0 授權或 Llama 2 社群授權來授權。 Databricks 建議檢閱這些授權,以確保符合任何適用的條款。 如果模型在未來根據 Databricks 的內部基準檢驗而表現更好,Databricks 可能會變更模型(以及此頁面提供的適用授權清單)。

目前, Mixtral-8x7B 指示 是支持這些 AI 函式的基礎模型。

語法

ai_extract(content, labels)

引數

  • contentSTRING:表達式。
  • labels:常 ARRAY<STRING> 值。 每個元素都是要擷取的實體類型。

傳回

STRUCT 其中每個欄位對應至 中指定的 labels實體類型。 每個欄位都包含代表擷取實體的字串。 如果找到任何實體類型的多個候選專案,則只會傳回一個。

如果 contentNULL,則結果為 NULL

範例

> SELECT ai_extract(
    'John Doe lives in New York and works for Acme Corp.',
    array('person', 'location', 'organization')
  );
 {"person": "John Doe", "location": "New York", "organization": "Acme Corp."}

> SELECT ai_extract(
    'Send an email to jane.doe@example.com about the meeting at 10am.',
    array('email', 'time')
  );
 {"email": "jane.doe@example.com", "time": "10am"}