다음을 통해 공유


ai_extract 함수

적용 대상:체크 마크가 표시된 예 Databricks SQL 체크 마크가 표시된 예 Databricks Runtime

중요함

이 기능은 공개 미리 보기HIPAA 규격에 있습니다.

미리 보기 중:

  • 기본 언어 모델은 여러 언어를 처리할 수 있지만 이 AI 함수는 영어로 조정됩니다.
  • AI Functions의 지역 가용성에 대한 지역별로 제한된 기능을 참조하세요.

ai_extract() 함수를 사용하면 최신 생성 AI 모델을 호출하여 SQL을 사용하여 지정된 텍스트에서 레이블로 지정된 엔터티를 추출할 수 있습니다. 이 함수는 Databricks Foundation 모델 API에서 사용할 수 있는 엔드포인트를 제공하는 채팅 모델을 사용합니다.

요구 사항

중요함

현재 사용할 수 있는 기본 모델은 Apache 2.0 라이선스, Copyright © The Apache Software Foundation 또는 LLAMA 3.3 Community License Copyright © Meta Platforms, Inc.에 따라 라이선스가 부여됩니다. 모든 권한이 예약되어 있습니다. 고객은 해당 모델 라이선스를 준수할 책임이 있습니다.

Databricks는 해당 조건을 준수하도록 이러한 라이선스를 검토할 것을 권장합니다. Databricks의 내부 벤치마크에 따라 더 나은 성능을 제공하는 모델이 향후에 나타날 경우 Databricks는 모델(및 이 페이지에 제공된 해당 라이선스 목록)을 변경할 수 있습니다.

  • 이 함수는 일괄 처리 유추에 최적화된 AI 함수를 지원하는 지역의 작업 영역에서만 사용할 수 있습니다.
  • 이 기능은 Azure Databricks SQL 클래식에서는 사용할 수 없습니다.
  • Databricks SQL 가격 페이지를 확인하세요.
  • Databricks Runtime 15.1 이상에서는 이 함수가 Databricks 노트북뿐만 아니라 Databricks 워크플로의 태스크로 실행되는 노트북에서도 지원됩니다.
  • 성능 향상을 위해서는 일괄 처리 유추 워크로드에 Databricks Runtime 15.4 ML LTS가 필요합니다.

참고

Databricks Runtime 15.1 이상에서는 이 함수가 Databricks 노트북뿐만 아니라 Databricks 워크플로의 태스크로 실행되는 노트북에서도 지원됩니다.

구문

ai_extract(content, labels)

논쟁

  • content: STRING 식입니다.
  • labels: ARRAY<STRING> 리터럴 상수. 각 요소는 추출할 엔터티의 형식입니다.

반품

STRUCT에서 지정된 엔터티 유형에 각 필드가 대응하는 labels. 각 필드에는 추출된 엔터티를 나타내는 문자열이 포함됩니다. 엔터티 형식에 대해 둘 이상의 후보가 발견되면 하나만 반환됩니다.

contentNULL이면 결과는 NULL입니다.

예제

> SELECT ai_extract(
    'John Doe lives in New York and works for Acme Corp.',
    array('person', 'location', 'organization')
  );
 {"person": "John Doe", "location": "New York", "organization": "Acme Corp."}

> SELECT ai_extract(
    'Send an email to jane.doe@example.com about the meeting at 10am.',
    array('email', 'time')
  );
 {"email": "jane.doe@example.com", "time": "10am"}