Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Metadata agen (juga dikenal sebagai metadata semantik) meningkatkan visualisasi data dan meningkatkan akurasi model bahasa besar (LLM) dengan memberikan nama tampilan, spesifikasi format, dan sinonim yang memberikan konteks bisnis untuk metrik Anda. Metadata ini membantu alat visualisasi dan alat bahasa alami seperti Genie Spaces menafsirkan dan bekerja dengan data Anda secara lebih efektif.
Nota
Memerlukan Databricks Runtime 17.3 dan YAML versi 1.1. Lihat persyaratan versi.
Apa itu metadata agen?
Metadata agen mencakup nama tampilan, spesifikasi format, dan sinonim yang menyediakan konteks tambahan. Metadata ini membantu alat visualisasi, seperti dasbor AI/BI, dan alat bahasa alami, seperti Genie Spaces, menafsirkan dan bekerja dengan data Anda secara lebih efektif. Metadata agen didefinisikan dalam definisi YAML tampilan metrik.
Nota
Saat Anda membuat atau mengubah tampilan metrik dengan spesifikasi versi 1.1, komentar baris tunggal apa pun (ditandai dengan #) dalam definisi YAML dihapus saat definisi disimpan. Lihat Meningkatkan ke YAML 1.1 untuk opsi dan rekomendasi saat meningkatkan definisi YAML yang ada.
Contoh di halaman ini menggunakan himpunan data sampel TPC-H (samples.tpch.orders), yang tersedia secara default di himpunan data Unity Catalog. Himpunan data TPC-H memodelkan rantai pasokan grosir dengan tabel untuk pesanan, pelanggan, pemasok, dan bagian. Nama kolom dalam orders tabel menggunakan awalan o_ (misalnya, o_orderdate untuk tanggal pesanan, o_totalprice untuk harga total). Untuk detail tentang skema TPC-H dan model data, lihat Tutorial: Membuat tampilan metrik lengkap dengan gabungan.
Nama tampilan
Nama tampilan menyediakan label yang dapat dibaca manusia yang muncul di alat visualisasi alih-alih nama kolom teknis. Nama tampilan dibatasi hingga 255 karakter.
Contoh berikut menunjukkan nama tampilan yang ditentukan pada order_date dimensi (pelacakan saat pesanan ditempatkan) dan total_revenue ukuran (menghitung jumlah semua harga pesanan).
version: 1.1
source: samples.tpch.orders
dimensions:
- name: order_date
expr: o_orderdate
display_name: 'Order Date'
measures:
- name: total_revenue
expr: SUM(o_totalprice)
display_name: 'Total Revenue'
Synonyms
Sinonim membantu alat LLM, seperti Genie, menemukan dimensi dan pengukuran melalui input pengguna dengan memberikan nama alternatif. Anda dapat menentukan sinonim menggunakan GAYA blok atau gaya alur YAML. Setiap dimensi atau ukuran dapat memiliki hingga 10 sinonim. Setiap sinonim dibatasi hingga 255 karakter.
Contoh berikut menunjukkan sinonim yang ditentukan pada dimensi order_date (saat pesanan dipasang) dan ukuran total_revenue (jumlah semua harga pesanan). Sinonim memungkinkan pengguna untuk mengajukan pertanyaan menggunakan bahasa alami seperti "tunjukkan pendapatan menurut waktu pesanan" atau "apa itu total penjualan berdasarkan tanggal pesanan":
version: 1.1
source: samples.tpch.orders
dimensions:
- name: order_date
expr: o_orderdate
# block style
synonyms:
- 'order time'
- 'date of order'
measures:
- name: total_revenue
expr: SUM(o_totalprice)
# flow style
synonyms: ['revenue', 'total sales']
Spesifikasi format
Spesifikasi format menentukan bagaimana nilai harus ditampilkan dalam alat visualisasi. Tabel berikut ini menyertakan jenis format dan contoh yang didukung.
Format numerik
| Jenis Format | Opsi yang Diperlukan | Pilihan Opsional |
|---|---|---|
| Angka: Gunakan format angka biasa untuk nilai numerik umum dengan kontrol tempat desimal opsional dan opsi singkatan. | type: number |
|
| Mata Uang: Gunakan format mata uang untuk nilai moneter dengan kode mata uang ISO-4217. | type: currency |
|
| Persentase: Gunakan format persentase untuk nilai rasio yang dinyatakan sebagai persentase. | type: percentage |
|
| Byte: Gunakan format byte untuk nilai ukuran data yang ditampilkan dengan unit byte yang sesuai (KB, MB, GB, dll.). | type: byte |
|
Contoh pemformatan numerik
Angka
format:
type: number
decimal_places:
type: max
places: 2
hide_group_separator: false
abbreviation: compact
Mata Uang
format:
type: currency
currency_code: USD
decimal_places:
type: exact
places: 2
hide_group_separator: false
abbreviation: compact
Persentase
format:
type: percentage
decimal_places:
type: all
hide_group_separator: true
Byte
format:
type: byte
decimal_places:
type: max
places: 2
hide_group_separator: false
Format tanggal dan waktu
Tabel berikut menjelaskan cara bekerja dengan format tanggal dan waktu.
| Jenis Format | Opsi yang Diperlukan | Pilihan Opsional |
|---|---|---|
| Tanggal: Gunakan format tanggal untuk nilai tanggal dengan berbagai opsi tampilan. |
|
|
| DateTime: Gunakan format tanggal dan waktu untuk nilai cap waktu yang menggabungkan tanggal dan waktu. |
|
|
Nota
Saat bekerja dengan date_time tipe, setidaknya salah satu dari date_format atau time_format harus menetapkan nilai yang berbeda dari no_date atau no_time.
Contoh pemformatan tanggalwaktu
Tanggal
format:
type: date
date_format: year_month_day
leading_zeros: true
DateTime
format:
type: date_time
date_format: year_month_day
time_format: locale_hour_minute_second
leading_zeros: false
Integrasi alat-alat hilir
Metadata semantik secara otomatis mengisi alat hilir yang menggunakan tampilan metrik:
- Dasbor AI/BI: Nama tampilan dan spesifikasi format secara otomatis diisi dalam himpunan data dasbor dan visualisasi untuk meningkatkan keterbacaan dasbor.
- Genie Spaces: Sinonim secara otomatis diimpor untuk membantu Genie menemukan dan memahami dimensi dan ukuran yang tersedia dengan lebih baik dari tampilan metrik.
Contoh lengkap
Contoh berikut menunjukkan definisi tampilan metrik yang melacak performa penjualan dan menyertakan semua jenis metadata agen. Tampilan metrik menganalisis data pesanan untuk menghitung metrik pendapatan, mengesegmentasi pelanggan berdasarkan nilai pesanan, dan melacak volume pesanan.
Segmen pelanggan didefinisikan sebagai berikut:
- Perusahaan: Pesanan lebih dari $100.000
- Pasar menengah: Pesanan antara $10.000 dan $100.000
- Bisnis kecil dan menengah: Pesanan di bawah $10.000
Metadata mendukung kueri bahasa alami seperti "tunjukkan total penjualan menurut segmen pelanggan" atau "berapa pendapatan rata-rata per pesanan."
version: 1.1
source: samples.tpch.orders
comment: Comprehensive sales metrics with enhanced semantic metadata
dimensions:
- name: order_date
expr: o_orderdate
comment: Date when the order was placed
display_name: Order Date
format:
type: date
date_format: year_month_day
leading_zeros: true
synonyms:
- order time
- date of order
- name: customer_segment
expr: |
CASE
WHEN o_totalprice > 100000 THEN 'Enterprise'
WHEN o_totalprice > 10000 THEN 'Mid-market'
ELSE 'SMB'
END
comment: Customer classification based on order value
display_name: Customer Segment
synonyms:
- segment
- customer tier
measures:
- name: total_revenue
expr: SUM(o_totalprice)
comment: Total revenue from all orders
display_name: Total Revenue
format:
type: currency
currency_code: USD
decimal_places:
type: exact
places: 2
hide_group_separator: false
abbreviation: compact
synonyms:
- revenue
- total sales
- sales amount
- name: order_count
expr: COUNT(1)
comment: Total number of orders
display_name: Order Count
format:
type: number
decimal_places:
type: all
hide_group_separator: true
synonyms:
- count
- number of orders
- name: avg_order_value
expr: SUM(o_totalprice) / COUNT(1)
comment: Average revenue per order
display_name: Average Order Value
format:
type: currency
currency_code: USD
decimal_places:
type: exact
places: 2
synonyms:
- aov
- average revenue