Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfada, ölçüm görünümlerini ve bunlarla çalışmaya yönelik en iyi yöntemleri modelleme açıklanmaktadır.
Ölçüm görünümleri verileriniz için anlam katmanı oluşturmaya yardımcı olur ve ham tabloları standartlaştırılmış, iş dostu ölçümlere dönüştürür. Kuruluş genelindeki her kullanıcının aynı Anahtar Performans Göstergesi (KPI) için aynı sayıyı raporlamasını sağlayarak nelerin ölçüldüğünü, nasıl toplanacağı ve nasıl segmentlere bölüneceklerini tanımlar. Amaç, iş ölçümleri için tek bir gerçeklik kaynağı oluşturmaktır.
Verilerinizi ölçüm görünümleri olarak modelleyerek karmaşık SQL, tablo yapıları ve veri kalitesi sorunlarını soyutlayarak analistlerin yalnızca analize odaklanmasını sağlarsınız.
Temel bileşenler
Ölçüm görünümünü modellemek için kaynak verileriniz üzerinde aşağıdaki öğelerin tanımlanması gerekir:
| Bileşen | Description | Example |
|---|---|---|
| Kaynak | Ham işlem verilerini içeren temel tablo, görünüm veya SQL sorgusu. | samples.tpch.orders |
| Boyutlar | Ölçümleri segmentlere ayırmak veya gruplandırmak için kullanılan sütun öznitelikleri | Ürün kategorisi, Sipariş ayı, Müşteri bölgesi |
| Önlem -ler | Ölçümleri oluşturan sütun toplamaları. Bu ölçüler genellikle raporladığınız ölçülerdir. |
COUNT(o_order_id) Sipariş Sayısı olarak, SUM(o_total_price) Toplam Gelir olarak. |
| Filtreler | Kapsamı tanımlamak için kaynak verilere uygulanan kalıcı koşullar. |
|
Kaynak tanımlama
Ölçüm görünümünüzün kaynağı olarak tablo benzeri bir varlık veya SQL sorgusu kullanabilirsiniz. Tablo benzeri bir varlık kullanmak için, varlık üzerinde en az SELECT ayrıcalıklara sahip olmanız gerekir.
Kaynak olarak tablo kullanma
Bir tabloyu kaynak olarak kullanmak için, aşağıdaki örnekte olduğu gibi tam tablo adını ekleyin.
source: samples.tpch.orders
Sql sorgusunu kaynak olarak kullanma
SQL sorgusu kullanmak için sorgu metnini doğrudan YAML'ye yazın.
source: SELECT * FROM samples.tpch.orders o
LEFT JOIN samples.tpch.customer c
ON o.o_custkey = c.c_custkey
Uyarı
Databricks, JOIN yan tümcesi olan bir SQL sorgusunu kaynak olarak kullanırken, temel tablolarda birincil ve yabancı anahtar kısıtlamalarının ayarlanmasını ve varsa sorgu zamanında en iyi performansı sağlamak için RELY seçeneğinin kullanılmasını önerir. Birincil ve yabancı anahtar kısıtlamalarını kullanma hakkında daha fazla bilgi için bkz. Birincil anahtar ve yabancı anahtar ilişkilerini bildirme veBirincil anahtar kısıtlamalarını kullanarak sorgu iyileştirme.
Ölçüm görünümünü kaynak olarak kullanın
Yeni bir ölçüm görünümünün kaynağı olarak mevcut bir ölçüm görünümünü de kullanabilirsiniz:
version: 1.1
source: views.examples.source_metric_view
dimensions:
# Dimension referencing dimension from source_metric_view
- name: Order date
expr: order_date_dim
measures:
# Measure referencing dimension from source_metric_view
- name: Latest order month
expr: MAX(order_date_dim_month)
# Measure referencing measure from source_metric_view
- name: Latest order year
expr: DATE_TRUNC('year', MEASURE(max_order_date_measure))
Kaynak olarak bir ölçüm görünümü kullanılırken, boyut ve ölçülere başvurmak için aynı birleştirme kuralları geçerlidir. Bkz. Oluşturma.
Boyutlar
Boyutlar, sorgu zamanında SELECT, WHERE ve GROUP BY sütunlardır. Her ifade bir skaler değer döndürmelidir. Boyutlar bir dizi olarak tanımlanır. Her boyut iki bileşenden oluşur:
name: Sütunun diğer adı.expr: Ölçüm görünümünde boyutu veya önceden tanımlanmış bir boyutu tanımlayan kaynak verilerde bir SQL ifadesi.
Uyarı
Sürüm 1.1'den başlayarak, her boyut için anlam meta verileri (görünen ad, biçim ve eş anlamlılar) da tanımlayabilirsiniz. Ayrıntılar için bkz. Ölçüm görünümlerinde anlam meta verilerini kullanma .
Önlem -ler
Ölçüler, önceden belirlenmiş bir toplama düzeyi olmadan sonuç üreten bir ifade dizisi olarak tanımlanan sütunlardır. Bunlar toplama işlevleri kullanılarak ifade edilmelidir. Sorgudaki bir ölçüye başvurmak için işlevini kullanmanız MEASURE gerekir. Ölçüler, kaynak verilerdeki veya önceki tanımlı boyutlardaki temel alanlara başvurabilir. Her ölçü aşağıdaki bileşenlerden oluşur:
name: Ölçünün diğer adı.expr: SQL toplama işlevlerini içerebilen bir toplam SQL ifadesi.
Aşağıdaki örnekte yaygın ölçü desenleri gösterilmektedir:
measures:
# Simple count measure
- name: Order Count
expr: COUNT(1)
# Sum aggregation measure
- name: Total Revenue
expr: SUM(o_totalprice)
# Distinct count measure
- name: Unique Customers
expr: COUNT(DISTINCT o_custkey)
# Calculated measure combining multiple aggregations
- name: Average Order Value
expr: SUM(o_totalprice) / COUNT(DISTINCT o_orderkey)
# Filtered measure with WHERE condition
- name: High Priority Order Revenue
expr: SUM(o_totalprice) FILTER (WHERE o_orderpriority = '1-URGENT')
# Measure using a dimension
- name: Average Revenue per Month
expr: SUM(o_totalprice) / COUNT(DISTINCT DATE_TRUNC('MONTH', o_orderdate))
Toplama işlevlerinin listesi için bkz. Toplama işlevleri.
measure toplama işlevinebakın.
Uyarı
Sürüm 1.1'den başlayarak, her ölçü için anlam meta verileri (görünen ad, biçim ve eş anlamlılar) da tanımlayabilirsiniz. Ayrıntılar için bkz. Ölçüm görünümlerinde anlam meta verilerini kullanma .
Filtre uygulama
Ölçüm görünümünün YAML tanımındaki bir filtre, buna başvuran tüm sorgular için geçerlidir. SQL mantıksal ifadesi olarak yazılmalıdır ve SQL sorgusunda bir WHERE tümcesi kullanmaya eşdeğerdir.
Aşağıdaki örnekte yaygın filtre desenleri gösterilmektedir:
# Single condition filter
filter: o_orderdate > '2024-01-01'
# Multiple conditions with AND
filter: o_orderdate > '2024-01-01' AND o_orderstatus = 'F'
# Multiple conditions with OR
filter: o_orderpriority = '1-URGENT' OR o_orderpriority = '2-HIGH'
# Complex filter with IN clause
filter: o_orderstatus IN ('F', 'P') AND o_orderdate >= '2024-01-01'
# Filter with NOT
filter: o_orderstatus != 'O' AND o_totalprice > 1000.00
# Filter with LIKE pattern matching
filter: o_comment LIKE '%express%' AND o_orderdate > '2024-01-01'
Ölçüm görünümlerini sorgularken veya kullanırken de filtre ekleyebilirsiniz.
Gelişmiş modelleme özellikleri
Ölçüm görünümü modelleme, gelişmiş ve yüksek oranda yeniden kullanılabilir ölçümler oluşturmak için gelişmiş teknikleri destekler.
Joins
Birleştirmeler, ölçüm görünümünüzü ilgili tablolardaki açıklayıcı özniteliklerle zenginleştirmenize olanak sağlar. Birleşimleri kullanarak olgu tablosundan boyut tablolarına (yıldız şeması) ilişkileri modelleyebilir ve boyutlardan alt boyutlara geçiş yaparak normalleştirilmiş boyut tablolarında (snowflake şeması) çok atlamalı birleştirmeler yapabilirsiniz.
Bkz. Ölçüm görünümlerinde birleştirmeleri kullanma.
Pencere ölçüleri
Pencere ölçüleri, ölçüm görünümlerinizde pencerelenmiş, birikimli veya yarı toplamsal toplamalar içeren ölçüler tanımlamanıza olanak tanır. Bu ölçü türleri, hareketli ortalamalar, dönem içindeki değişiklikler ve çalışan toplamlar gibi daha karmaşık hesaplamalara olanak sağlar. Ölçüm görünümlerinde pencere ölçülerinin nasıl kullanılacağını gösteren örnekler için bkz. Ölçüm görünümlerinde pencere ölçülerini kullanma.
Oluşturulabilirlik
Ölçüm görünümleri birleştirilebilir ve daha önce tanımlanmış öğelere başvurarak karmaşık mantık oluşturmanıza olanak sağlar. Daha önce tanımlanmış boyutlara yeni boyutlarda başvurabilir, yeni ölçülerde herhangi bir boyuta veya önceden tanımlanmış ölçülere başvurabilir ve ölçüm görünümünde tanımlanan birleşimlerden sütunlara başvurabilirsiniz.
Bkz. Ölçüm görünümlerinde bileştirilebilirlik.
Anlam meta verileri
Anlamsal meta veriler, araçların ölçü ve boyutları görüntüleme ve işleme şekillerini anlamalarına yardımcı olur. Bu, aşağıdaki gibi özellikleri içerir:
| Anlam meta verileri | Example |
|---|---|
| Görünen adlar |
Total Revenueyerine sum_o_price. |
| Görüntüleme biçimi | Para birimi, yüzdeler ve tarihler için biçimlendirmeyi standartlaştırabilirsiniz. |
| Comments | Ölçümün iş tanımını doğal dilde açıklama. |
Anlam meta verileri tanımladığınızda, ölçümle birlikte hareket eder. Örneğin analistler bir panoda Total Revenue kullandığında otomatik olarak para birimi olarak görüntülenir.
Bkz . Ölçüm görünümlerinde anlam meta verilerini kullanma.
YAML söz dizimi ve biçimlendirmesi
Ölçüm görünümü tanımları standart YAML gösterimi söz dizimini izler. Ölçüm görünümünü tanımlamak için gerekli söz dizimi ve biçimlendirme hakkında bilgi edinmek için bkz. YAML söz dizimi başvurusu . YAML belirtimleri hakkında daha fazla bilgi edinmek için YAML Belirtimi 1.2.2 belgelerine bakın.
Pencere ölçüleri
Pencere ölçüleri, tanımlı bir pencere veya geçerli satırla ilgili satır aralığı üzerinden bir değer hesaplar. Zaman serisi ve karşılaştırmalı analiz için pencere ölçülerini kullanarak aşağıdaki gibi ölçümleri tanımlayabilirsiniz:
- 30 Günlük Toplam Gelir: Son 30 gün içindeki gelir toplamı
- Yıl Başından Bugüne (YTD) Gelir: Yılın başından itibaren toplu toplam
- Önceki Dönem Karşılaştırması: Önceki aya ait gelir
Bkz Metrik görünümlerinde pencere ölçülerini kullanma.
Ölçüm görünümlerinin modellenmesi için en iyi uygulamalar
Ölçüm görünümlerini modellerken aşağıdaki yönergeleri kullanın:
-
Model atomik ölçüleri: İlk olarak en basit, hesaplanmamış ölçüleri (örneğin ,
SUM(revenue)COUNT(DISTINCT customer_id)) tanımlayarak başlayın. Birleştirilebilirliği kullanarak karmaşık ölçümler (AOV gibi) oluşturun. -
Boyut değerlerini standartlaştırma: Şifrelemeli veritabanı kodlarını açık iş adlarına dönüştürmek için dönüştürmeleri (deyimler veya ifadeler gibi
CASE) kullanın (örneğin, 'O' sipariş durumunu 'Open' ve 'F' değerini 'Fulfilled' olarak dönüştürün). - Filtrelerle kapsam tanımlama: Kalıcı filtreler hakkında bilinçli olun. Ölçüm görünümünün yalnızca tamamlanmış siparişleri içermesi gerekiyorsa, kullanıcıların yanlışlıkla eksik verileri ekleyememesi için bu filtreyi ölçüm görünümünde tanımlayın.
-
İş dostu adlandırmayı kullanma: Ölçüm adları iş kullanıcıları tarafından hemen tanınabilir olmalıdır (örneğin, Müşteri Yaşam Süresi Değeri ile
cltv_agg_measure). - Ayrı zaman boyutları: Ayrıntı düzeyi ve eğilim analizini desteklemek için her zaman ayrıntılı zaman boyutlarını ( Sipariş Tarihi gibi) ve kesilmiş zaman boyutlarını ( Sipariş Ayı veya Sipariş Haftası gibi) içerir.