Sdílet prostřednictvím


Funkce ai_extract

Platí pro:zaškrtnuto ano Databricks SQL zaškrtnuto ano Databricks Runtime

Důležité

Tato funkce je ve verzi Public Preview a kompatibilní se standardem HIPAA.

Během náhledu:

Funkce ai_extract() umožňuje vyvolat nejmodernější model generující umělé inteligence k extrakci entit určených popisky z daného textu pomocí SQL. Tato funkce používá chatovací model obsluhující koncový bod dostupný rozhraními API modelu Foundation Databricks.

Požadavky

Důležité

Základní modely, které mohou být v tuto chvíli použity, jsou licencovány v rámci licence Apache 2.0, Copyright © Apache Software Foundation nebo LLAMA 3.3 Community License Copyright © Meta Platforms, Inc. Všechna práva vyhrazena. Zákazníci zodpovídají za dodržení platných modelových licencí.

Databricks doporučuje zkontrolovat tyto licence, abyste zajistili soulad s platnými podmínkami. Pokud se modely objeví v budoucnu, které fungují lépe podle interních srovnávacích testů Databricks, může Databricks změnit model (a seznam použitelných licencí uvedených na této stránce).

  • Tato funkce je dostupná pouze v pracovních prostorech v oblastech, které podporují funkce AI optimalizované pro dávkové odvozování.
  • Tato funkce není dostupná v Azure Databricks SQL Classic.
  • Podívejte se na stránku s cenami SQL služby Databricks.
  • V Databricks Runtime 15.1 a novějších je tato funkce podporovaná v poznámkových blocích Databricks, včetně poznámkových bloků, které se spouští jako úkol v pracovním postupu Databricks.
  • Úlohy hromadné inferencí vyžadují pro zvýšení výkonu Databricks Runtime 15.4 ML LTS.

Poznámka:

V Databricks Runtime 15.1 a novějších je tato funkce podporovaná v poznámkových blocích Databricks, včetně poznámkových bloků, které se spouští jako úkol v pracovním postupu Databricks.

Syntaxe

ai_extract(content, labels)

Argumenty

  • content: Výraz STRING.
  • labels: Doslovný výraz ARRAY<STRING>. Každý prvek je typ entity, která se má extrahovat.

Návraty

STRUCT, kde každé pole odpovídá typu entity zadanému v labels. Každé pole obsahuje řetězec představující extrahovaná entita. Pokud se najde více než jeden kandidát pro jakýkoli typ entity, vrátí se pouze jeden.

Pokud content je NULL, výsledek je NULL.

Příklady

> SELECT ai_extract(
    'John Doe lives in New York and works for Acme Corp.',
    array('person', 'location', 'organization')
  );
 {"person": "John Doe", "location": "New York", "organization": "Acme Corp."}

> SELECT ai_extract(
    'Send an email to jane.doe@example.com about the meeting at 10am.',
    array('email', 'time')
  );
 {"email": "jane.doe@example.com", "time": "10am"}