에이전트 메타데이터(의미 체계 메타데이터라고도 함)는 데이터 시각화를 향상시키고 표시 이름, 형식 사양 및 비즈니스 컨텍스트를 메트릭에 제공하는 동의어를 제공하여 LLM(대규모 언어 모델) 정확도를 향상시킵니다. 이 메타데이터는 시각화 도구와 Genie Spaces 와 같은 자연어 도구가 데이터를 보다 효과적으로 해석하고 작업하는 데 도움이 됩니다.
메모
Databricks Runtime 17.3 및 YAML 버전 1.1이 필요합니다. 버전 요구 사항을 참조하세요.
에이전트 메타데이터란?
에이전트 메타데이터에는 추가 컨텍스트를 제공하는 표시 이름, 형식 사양 및 동의어가 포함됩니다. 이 메타데이터는 AI/BI 대시보드와 같은 시각화 도구와 Genie Spaces와 같은 자연어 도구를 사용하여 데이터를 보다 효과적으로 해석하고 작업하는 데 도움이 됩니다. 에이전트 메타데이터는 메트릭 뷰 YAML 정의에 정의됩니다.
메모
사양 버전 1.1을 사용하여 메트릭 뷰를 만들거나 변경하면 정의가 저장될 때 YAML 정의의 모든 한 줄 주석( #표시된 주석)이 제거됩니다. 기존 YAML 정의를 업그레이드할 때 옵션 및 권장 사항은 YAML 1.1 로 업그레이드를 참조하세요.
이 페이지의 예제에서는 samples.tpch.orders 데이터 세트에서 사용할 수 있는 TPC-H 샘플 데이터 세트()를 사용합니다. TPC-H 데이터 세트는 주문, 고객, 공급업체 및 부품에 대한 테이블이 있는 도매 공급망을 모델로 합니다. 테이블의 orders 열 이름은 접두사를 o_ 사용합니다(예: o_orderdate 주문 날짜, o_totalprice 총 가격). TPC-H 스키마 및 데이터 모델에 대한 자세한 내용은 자습서: 조인을 사용하여 전체 메트릭 보기 빌드를 참조하세요.
표시 이름
표시 이름은 기술 열 이름 대신 시각화 도구에 표시되는 사람이 읽기 쉬운 레이블을 제공합니다. 표시 이름은 255자로 제한됩니다.
다음 예제에서는 차원에 order_date 정의된 표시 이름(주문이 이루어진 시점 추적) 및 total_revenue 측정값(모든 주문 가격의 합계 계산)을 보여 줍니다.
version: 1.1
source: samples.tpch.orders
dimensions:
- name: order_date
expr: o_orderdate
display_name: 'Order Date'
measures:
- name: total_revenue
expr: SUM(o_totalprice)
display_name: 'Total Revenue'
Synonyms
동의어는 Genie와 같은 LLM 도구가 대체 이름을 제공하여 사용자 입력을 통해 차원 및 측정값을 검색하는 데 도움이 됩니다. 블록 스타일 또는 흐름 스타일 YAML을 사용하여 동의어를 정의할 수 있습니다. 각 차원 또는 측정값에는 최대 10개의 동의어가 있을 수 있습니다. 각 동의어는 255자로 제한됩니다.
다음 예제에서는 order_date 차원(주문이 이루어진 시점)에 정의된 동의어와 total_revenue 측정값(모든 주문 가격의 합계)을 보여 줍니다. 동의어를 사용하면 "주문 시간별 수익 표시" 또는 "주문 날짜별 총 판매액"과 같은 자연어를 사용하여 질문을 할 수 있습니다.
version: 1.1
source: samples.tpch.orders
dimensions:
- name: order_date
expr: o_orderdate
# block style
synonyms:
- 'order time'
- 'date of order'
measures:
- name: total_revenue
expr: SUM(o_totalprice)
# flow style
synonyms: ['revenue', 'total sales']
형식 사양
형식 사양은 시각화 도구에 값을 표시하는 방법을 정의합니다. 다음 표에는 지원되는 형식 형식 및 예제가 포함되어 있습니다.
숫자 형식
| 형식 형식 | 필수 옵션 | 선택적 옵션 |
|---|---|---|
| 숫자: 선택적 소수 자릿수 컨트롤 및 약어 옵션을 사용하여 일반 숫자 값에 일반 숫자 형식을 사용합니다. | type: number |
|
| 통화: ISO-4217 통화 코드에서 통화 값에 통화 형식을 사용합니다. | type: currency |
|
| 백분율: 백분율로 표현된 비율 값에 백분율 형식을 사용합니다. | type: percentage |
|
| 바이트: 적절한 바이트 단위(KB, MB, GB 등)로 표시되는 데이터 크기 값에 바이트 형식을 사용합니다. | type: byte |
|
숫자 서식 예제
Number
format:
type: number
decimal_places:
type: max
places: 2
hide_group_separator: false
abbreviation: compact
통화
format:
type: currency
currency_code: USD
decimal_places:
type: exact
places: 2
hide_group_separator: false
abbreviation: compact
백분율
format:
type: percentage
decimal_places:
type: all
hide_group_separator: true
Byte (바이트)
format:
type: byte
decimal_places:
type: max
places: 2
hide_group_separator: false
날짜 및 시간 형식
다음 표에서는 날짜 및 시간 형식을 사용하는 방법을 설명합니다.
| 형식 형식 | 필수 옵션 | 선택적 옵션 |
|---|---|---|
| 날짜: 다양한 표시 옵션을 사용하여 날짜 값에 날짜 형식을 사용합니다. |
|
|
| DateTime: 날짜와 시간을 결합한 타임스탬프 값에 날짜/시간 형식을 사용합니다. |
|
|
메모
형식 date_time을 사용할 때, date_format 또는 time_format 중 적어도 하나는 no_date 또는 no_time가 아닌 다른 값을 지정해야 합니다.
날짜/시간 서식 지정 예제
날짜
format:
type: date
date_format: year_month_day
leading_zeros: true
날짜/시간
format:
type: date_time
date_format: year_month_day
time_format: locale_hour_minute_second
leading_zeros: false
다운스트림 도구 통합
의미 체계 메타데이터는 메트릭 뷰를 사용하는 다운스트림 도구를 자동으로 채웁니다.
- AI/BI 대시보드: 대시보드 가독성을 향상시키기 위해 대시보드 데이터 세트 및 시각화에 표시 이름 및 형식 사양이 자동으로 채워집니다.
- 지니 공간: 동의어는 지니가 메트릭 보기에서 사용 가능한 차원과 측정값을 더 잘 검색하고 이해하는 데 도움이 되도록 자동으로 가져옵니다.
전체 예제
다음 예제에서는 판매 성능을 추적하고 모든 에이전트 메타데이터 유형을 포함하는 메트릭 뷰 정의를 보여 줍니다. 메트릭 뷰는 주문 데이터를 분석하여 수익 메트릭을 계산하고, 고객을 주문 값으로 분할하고, 주문 볼륨을 추적합니다.
고객 세그먼트는 다음과 같이 정의됩니다.
- 엔터프라이즈: $100,000 이상 주문
- 중간 시장: $10,000에서 $100,000 사이의 주문
- 중소기업: $10,000 미만 주문
메타데이터는 "고객 세그먼트별 총 매출 표시" 또는 "주문당 평균 수익이란 무엇인가요"와 같은 자연어 쿼리를 지원합니다.
version: 1.1
source: samples.tpch.orders
comment: Comprehensive sales metrics with enhanced semantic metadata
dimensions:
- name: order_date
expr: o_orderdate
comment: Date when the order was placed
display_name: Order Date
format:
type: date
date_format: year_month_day
leading_zeros: true
synonyms:
- order time
- date of order
- name: customer_segment
expr: |
CASE
WHEN o_totalprice > 100000 THEN 'Enterprise'
WHEN o_totalprice > 10000 THEN 'Mid-market'
ELSE 'SMB'
END
comment: Customer classification based on order value
display_name: Customer Segment
synonyms:
- segment
- customer tier
measures:
- name: total_revenue
expr: SUM(o_totalprice)
comment: Total revenue from all orders
display_name: Total Revenue
format:
type: currency
currency_code: USD
decimal_places:
type: exact
places: 2
hide_group_separator: false
abbreviation: compact
synonyms:
- revenue
- total sales
- sales amount
- name: order_count
expr: COUNT(1)
comment: Total number of orders
display_name: Order Count
format:
type: number
decimal_places:
type: all
hide_group_separator: true
synonyms:
- count
- number of orders
- name: avg_order_value
expr: SUM(o_totalprice) / COUNT(1)
comment: Average revenue per order
display_name: Average Order Value
format:
type: currency
currency_code: USD
decimal_places:
type: exact
places: 2
synonyms:
- aov
- average revenue