메트릭 뷰의 에이전트 메타데이터

에이전트 메타데이터(의미 체계 메타데이터라고도 함)는 데이터 시각화를 향상시키고 표시 이름, 형식 사양 및 비즈니스 컨텍스트를 메트릭에 제공하는 동의어를 제공하여 LLM(대규모 언어 모델) 정확도를 향상시킵니다. 이 메타데이터는 시각화 도구와 Genie Spaces 와 같은 자연어 도구가 데이터를 보다 효과적으로 해석하고 작업하는 데 도움이 됩니다.

메모

Databricks Runtime 17.3 및 YAML 버전 1.1이 필요합니다. 버전 요구 사항을 참조하세요.

에이전트 메타데이터란?

에이전트 메타데이터에는 추가 컨텍스트를 제공하는 표시 이름, 형식 사양 및 동의어가 포함됩니다. 이 메타데이터는 AI/BI 대시보드와 같은 시각화 도구와 Genie Spaces와 같은 자연어 도구를 사용하여 데이터를 보다 효과적으로 해석하고 작업하는 데 도움이 됩니다. 에이전트 메타데이터는 메트릭 뷰 YAML 정의에 정의됩니다.

메모

사양 버전 1.1을 사용하여 메트릭 뷰를 만들거나 변경하면 정의가 저장될 때 YAML 정의의 모든 한 줄 주석( #표시된 주석)이 제거됩니다. 기존 YAML 정의를 업그레이드할 때 옵션 및 권장 사항은 YAML 1.1 로 업그레이드를 참조하세요.

이 페이지의 예제에서는 samples.tpch.orders 데이터 세트에서 사용할 수 있는 TPC-H 샘플 데이터 세트()를 사용합니다. TPC-H 데이터 세트는 주문, 고객, 공급업체 및 부품에 대한 테이블이 있는 도매 공급망을 모델로 합니다. 테이블의 orders 열 이름은 접두사를 o_ 사용합니다(예: o_orderdate 주문 날짜, o_totalprice 총 가격). TPC-H 스키마 및 데이터 모델에 대한 자세한 내용은 자습서: 조인을 사용하여 전체 메트릭 보기 빌드를 참조하세요.

표시 이름

표시 이름은 기술 열 이름 대신 시각화 도구에 표시되는 사람이 읽기 쉬운 레이블을 제공합니다. 표시 이름은 255자로 제한됩니다.

다음 예제에서는 차원에 order_date 정의된 표시 이름(주문이 이루어진 시점 추적) 및 total_revenue 측정값(모든 주문 가격의 합계 계산)을 보여 줍니다.

version: 1.1
source: samples.tpch.orders

dimensions:
  - name: order_date
    expr: o_orderdate
    display_name: 'Order Date'

measures:
  - name: total_revenue
    expr: SUM(o_totalprice)
    display_name: 'Total Revenue'

Synonyms

동의어는 Genie와 같은 LLM 도구가 대체 이름을 제공하여 사용자 입력을 통해 차원 및 측정값을 검색하는 데 도움이 됩니다. 블록 스타일 또는 흐름 스타일 YAML을 사용하여 동의어를 정의할 수 있습니다. 각 차원 또는 측정값에는 최대 10개의 동의어가 있을 수 있습니다. 각 동의어는 255자로 제한됩니다.

다음 예제에서는 order_date 차원(주문이 이루어진 시점)에 정의된 동의어와 total_revenue 측정값(모든 주문 가격의 합계)을 보여 줍니다. 동의어를 사용하면 "주문 시간별 수익 표시" 또는 "주문 날짜별 총 판매액"과 같은 자연어를 사용하여 질문을 할 수 있습니다.

version: 1.1
source: samples.tpch.orders

dimensions:
  - name: order_date
    expr: o_orderdate
    # block style
    synonyms:
      - 'order time'
      - 'date of order'

measures:
  - name: total_revenue
    expr: SUM(o_totalprice)
    # flow style
    synonyms: ['revenue', 'total sales']

형식 사양

형식 사양은 시각화 도구에 값을 표시하는 방법을 정의합니다. 다음 표에는 지원되는 형식 형식 및 예제가 포함되어 있습니다.

숫자 형식

형식 형식 필수 옵션 선택적 옵션
숫자: 선택적 소수 자릿수 컨트롤 및 약어 옵션을 사용하여 일반 숫자 값에 일반 숫자 형식을 사용합니다. type: number
  • decimal_places: 소수점 뒤의 위치 수를 제어합니다.
    • type: (지정된 경우 decimal_places 필수)
      • max
      • exact
      • all
    • places: 0-10의 정수 값(형식 max 인 경우 필요)exact
  • hide_group_separator: true로 설정하면 해당하는 숫자 그룹 구분 기호(예: ,.)를 제거합니다.
    • true
    • false
  • abbreviation:
    • none
    • compact
    • scientific
통화: ISO-4217 통화 코드에서 통화 값에 통화 형식을 사용합니다. type: currency
  • currency_code: ISO-4217 코드(필수). 예를 들어 다음 코드는 각각 미국 달러, 유로 및 엔에 대한 기호를 삽입합니다.
    • USD
    • EUR
    • JPY
  • decimal_places: 소수점 뒤의 위치 수를 제어합니다.
    • type: (지정된 경우 decimal_places 필수)
      • max
      • exact
      • all
  • hide_group_separator: true로 설정하면 적용 가능한 숫자 그룹 구분 기호를 제거합니다.
    • true
    • false
  • abbreviation:
    • none
    • compact
    • scientific
백분율: 백분율로 표현된 비율 값에 백분율 형식을 사용합니다. type: percentage
  • decimal_places: 소수점 뒤의 위치 수를 제어합니다.
    • type: (지정된 경우 decimal_places 필수)
      • max
      • exact
      • all
  • hide_group_separator: true로 설정하면 적용 가능한 숫자 그룹 구분 기호를 제거합니다.
    • true
    • false
바이트: 적절한 바이트 단위(KB, MB, GB 등)로 표시되는 데이터 크기 값에 바이트 형식을 사용합니다. type: byte
  • decimal_places: 소수점 뒤의 위치 수를 제어합니다.
    • type: (지정된 경우 decimal_places 필수)
      • max
      • exact
      • all
    • places: 0-10의 정수 값(형식 max 인 경우 필요)exact
  • hide_group_separator: true로 설정하면 적용 가능한 숫자 그룹 구분 기호를 제거합니다.
    • true
    • false

숫자 서식 예제

Number

format:
  type: number
  decimal_places:
    type: max
    places: 2
  hide_group_separator: false
  abbreviation: compact

통화

format:
  type: currency
  currency_code: USD
  decimal_places:
    type: exact
    places: 2
  hide_group_separator: false
  abbreviation: compact

백분율

format:
  type: percentage
  decimal_places:
    type: all
  hide_group_separator: true

Byte (바이트)

format:
  type: byte
  decimal_places:
    type: max
    places: 2
  hide_group_separator: false

날짜 및 시간 형식

다음 표에서는 날짜 및 시간 형식을 사용하는 방법을 설명합니다.

형식 형식 필수 옵션 선택적 옵션
날짜: 다양한 표시 옵션을 사용하여 날짜 값에 날짜 형식을 사용합니다.
  • type: date
  • date_format: 날짜가 표시되는 방식을 제어합니다.
    • locale_short_month: 축약된 월을 사용하여 날짜를 표시합니다.
    • locale_long_month: 월의 전체 이름을 사용하여 날짜를 표시합니다.
    • year_month_day: 날짜를 YYYY-MM-DD 형식으로 지정합니다.
    • locale_number_month: 월이 있는 날짜를 숫자로 표시합니다.
    • year_week: 날짜의 형식을 연도 및 주 번호로 지정합니다. 예를 들어 2025-W1
  • leading_zeros: 한 자리 숫자 앞에 0이 오는지 여부를 제어합니다.
  • true
  • false
DateTime: 날짜와 시간을 결합한 타임스탬프 값에 날짜/시간 형식을 사용합니다.
  • type: date_time
  • date_format: 날짜가 표시되는 방식을 제어합니다.
    • no_date: 날짜가 숨겨져 있습니다.
    • locale_short_month: 축약된 월을 사용하여 날짜를 표시합니다.
    • locale_long_month: 월의 전체 이름을 사용하여 날짜를 표시합니다.
    • year_month_day: 날짜를 YYYY-MM-DD 형식으로 지정합니다.
    • locale_number_month: 월이 있는 날짜를 숫자로 표시합니다.
    • year_week: 날짜의 형식을 연도 및 주 번호로 지정합니다. 예를 들어 2025-W1
  • time_format:
    • no_time: 시간이 숨겨져 있습니다.
    • locale_hour_minute: 시간 및 분 표시
    • locale_hour_minute_second: 시간, 분 및 초를 표시합니다.
  • leading_zeros: 한 자리 숫자 앞에 0이 오는지 여부를 제어합니다.
    • true
    • false

메모

형식 date_time을 사용할 때, date_format 또는 time_format 중 적어도 하나는 no_date 또는 no_time가 아닌 다른 값을 지정해야 합니다.

날짜/시간 서식 지정 예제

날짜

format:
  type: date
  date_format: year_month_day
  leading_zeros: true

날짜/시간

format:
  type: date_time
  date_format: year_month_day
  time_format: locale_hour_minute_second
  leading_zeros: false

다운스트림 도구 통합

의미 체계 메타데이터는 메트릭 뷰를 사용하는 다운스트림 도구를 자동으로 채웁니다.

  • AI/BI 대시보드: 대시보드 가독성을 향상시키기 위해 대시보드 데이터 세트 및 시각화에 표시 이름 및 형식 사양이 자동으로 채워집니다.
  • 지니 공간: 동의어는 지니가 메트릭 보기에서 사용 가능한 차원과 측정값을 더 잘 검색하고 이해하는 데 도움이 되도록 자동으로 가져옵니다.

전체 예제

다음 예제에서는 판매 성능을 추적하고 모든 에이전트 메타데이터 유형을 포함하는 메트릭 뷰 정의를 보여 줍니다. 메트릭 뷰는 주문 데이터를 분석하여 수익 메트릭을 계산하고, 고객을 주문 값으로 분할하고, 주문 볼륨을 추적합니다.

고객 세그먼트는 다음과 같이 정의됩니다.

  • 엔터프라이즈: $100,000 이상 주문
  • 중간 시장: $10,000에서 $100,000 사이의 주문
  • 중소기업: $10,000 미만 주문

메타데이터는 "고객 세그먼트별 총 매출 표시" 또는 "주문당 평균 수익이란 무엇인가요"와 같은 자연어 쿼리를 지원합니다.

version: 1.1
source: samples.tpch.orders
comment: Comprehensive sales metrics with enhanced semantic metadata
dimensions:
  - name: order_date
    expr: o_orderdate
    comment: Date when the order was placed
    display_name: Order Date
    format:
      type: date
      date_format: year_month_day
      leading_zeros: true
    synonyms:
      - order time
      - date of order
  - name: customer_segment
    expr: |
      CASE
        WHEN o_totalprice > 100000 THEN 'Enterprise'
        WHEN o_totalprice > 10000 THEN 'Mid-market'
        ELSE 'SMB'
      END
    comment: Customer classification based on order value
    display_name: Customer Segment
    synonyms:
      - segment
      - customer tier
measures:
  - name: total_revenue
    expr: SUM(o_totalprice)
    comment: Total revenue from all orders
    display_name: Total Revenue
    format:
      type: currency
      currency_code: USD
      decimal_places:
        type: exact
        places: 2
      hide_group_separator: false
      abbreviation: compact
    synonyms:
      - revenue
      - total sales
      - sales amount
  - name: order_count
    expr: COUNT(1)
    comment: Total number of orders
    display_name: Order Count
    format:
      type: number
      decimal_places:
        type: all
      hide_group_separator: true
    synonyms:
      - count
      - number of orders
  - name: avg_order_value
    expr: SUM(o_totalprice) / COUNT(1)
    comment: Average revenue per order
    display_name: Average Order Value
    format:
      type: currency
      currency_code: USD
      decimal_places:
        type: exact
        places: 2
    synonyms:
      - aov
      - average revenue