Condividi tramite


Dati di visualizzazione delle metriche del modello

Questa pagina descrive come modellare le visualizzazioni delle metriche e le procedure consigliate per usarle.

Le visualizzazioni delle metriche consentono di creare un livello semantico per i dati, trasformando le tabelle non elaborate in metriche standardizzate e descrittive per l'azienda. Definiscono cosa misurare, come aggregarlo e come segmentarlo, assicurandosi che ogni utente nell'organizzazione restituisca lo stesso numero per lo stesso indicatore di prestazioni chiave (KPI). L'obiettivo è creare una singola fonte di verità per le metriche aziendali.

Modellando i dati come visualizzazioni delle metriche, si estraggono complessi problemi di SQL, strutture di tabella e qualità dei dati, consentendo agli analisti di concentrarsi esclusivamente sull'analisi.

Componenti principali

La modellazione di una visualizzazione delle metriche implica la definizione degli elementi seguenti sui dati di origine:

Componente Description Example
Fonte La tabella di base, la vista o la query SQL che contiene i dati transazionali grezzi. samples.tpch.orders
Dimensioni Attributi di colonna usati per segmentare o raggruppare le metriche Categoria di prodotti, Mese ordine, Area cliente
Misure Aggregazioni di colonne che producono le metriche. Queste misure sono quelle che in genere si segnalano. COUNT(o_order_id) come Conteggio ordini, SUM(o_total_price) come Ricavo totale.
Filtri Condizioni persistenti applicate ai dati di origine per definire l'ambito.
  • status = 'completed'
  • order_date > '2024-01-01'

Definire un'origine

È possibile usare un asset simile a una tabella o una query SQL come origine per la visualizzazione delle metriche. Per usare un asset simile a una tabella, è necessario avere almeno SELECT privilegi sull'asset.

Usare una tabella come origine

Per usare una tabella come origine, includere il nome completo della tabella, come nell'esempio seguente.

source: samples.tpch.orders

Usare una query SQL come origine

Per usare una query SQL, scrivere il testo della query direttamente in YAML.

source: SELECT * FROM samples.tpch.orders o
  LEFT JOIN samples.tpch.customer c
  ON o.o_custkey = c.c_custkey

Annotazioni

Quando si usa una query SQL come origine con una JOIN clausola , Databricks consiglia di impostare vincoli di chiave primaria ed esterna sulle tabelle sottostanti e di usare l'opzione RELY per ottenere prestazioni ottimali in fase di query, se applicabile. Per altre informazioni sull'uso di vincoli di chiave primaria ed esterna, vedere Dichiarare relazioni tra chiavi primarie ed esterne eOttimizzazione query tramite vincoli di chiave primaria.

Usare la visualizzazione delle metriche come origine

È anche possibile usare una visualizzazione metrica esistente come origine per una nuova visualizzazione metrica:

version: 1.1
source: views.examples.source_metric_view

dimensions:
  # Dimension referencing dimension from source_metric_view
  - name: Order date
    expr: order_date_dim

measures:
  # Measure referencing dimension from source_metric_view
  - name: Latest order month
    expr: MAX(order_date_dim_month)

  # Measure referencing measure from source_metric_view
  - name: Latest order year
    expr: DATE_TRUNC('year', MEASURE(max_order_date_measure))

Quando si usa una visualizzazione metrica come origine, si applicano le stesse regole di componibilità per fare riferimento a dimensioni e misure. Vedere Componibilità.

Dimensioni

Le dimensioni sono colonne usate nelle SELECT, WHERE e GROUP BY durante il tempo di interrogazione. Ogni espressione deve restituire un valore scalare. Le dimensioni vengono definite come matrice. Ogni dimensione è costituita da due componenti:

  • name: l'alias della colonna.

  • expr: espressione SQL sui dati di origine che definisce la dimensione o una dimensione definita in precedenza nella visualizzazione metrica.

Annotazioni

A partire dalla versione 1.1, è anche possibile definire metadati semantici (nome visualizzato, formato e sinonimi) per ogni dimensione. Per informazioni dettagliate, vedere Usare metadati semantici nelle visualizzazioni delle metriche .

Misure

Le misure sono colonne definite come matrice di espressioni che producono risultati senza un livello di aggregazione predeterminato. Devono essere espressi usando funzioni di aggregazione. Per fare riferimento a una misura in una query, è necessario usare la MEASURE funzione . Le misure possono fare riferimento ai campi di base nei dati di origine o nelle dimensioni definite in precedenza. Ogni misura è costituita dai componenti seguenti:

  • name: alias della misura.

  • expr: espressione SQL aggregata che può includere funzioni di aggregazione SQL.

L'esempio seguente illustra i modelli di misura comuni:

measures:
  # Simple count measure
  - name: Order Count
    expr: COUNT(1)

  # Sum aggregation measure
  - name: Total Revenue
    expr: SUM(o_totalprice)

  # Distinct count measure
  - name: Unique Customers
    expr: COUNT(DISTINCT o_custkey)

  # Calculated measure combining multiple aggregations
  - name: Average Order Value
    expr: SUM(o_totalprice) / COUNT(DISTINCT o_orderkey)

  # Filtered measure with WHERE condition
  - name: High Priority Order Revenue
    expr: SUM(o_totalprice) FILTER (WHERE o_orderpriority = '1-URGENT')

  # Measure using a dimension
  - name: Average Revenue per Month
    expr: SUM(o_totalprice) / COUNT(DISTINCT DATE_TRUNC('MONTH', o_orderdate))

Vedere Funzioni di aggregazione per un elenco di funzioni di aggregazione.

Vedere la funzione di aggregazione measuree.

Annotazioni

A partire dalla versione 1.1, è anche possibile definire metadati semantici (nome visualizzato, formato e sinonimi) per ogni misura. Per informazioni dettagliate, vedere Usare metadati semantici nelle visualizzazioni delle metriche .

Applicare filtri

Un filtro nella definizione YAML di una visualizzazione metrica si applica a tutte le query che vi fanno riferimento. Deve essere scritto come espressione booleana SQL ed è equivalente all'uso di una WHERE clausola in una query SQL.

L'esempio seguente illustra i modelli di filtro comuni:

# Single condition filter
filter: o_orderdate > '2024-01-01'

# Multiple conditions with AND
filter: o_orderdate > '2024-01-01' AND o_orderstatus = 'F'

# Multiple conditions with OR
filter: o_orderpriority = '1-URGENT' OR o_orderpriority = '2-HIGH'

# Complex filter with IN clause
filter: o_orderstatus IN ('F', 'P') AND o_orderdate >= '2024-01-01'

# Filter with NOT
filter: o_orderstatus != 'O' AND o_totalprice > 1000.00

# Filter with LIKE pattern matching
filter: o_comment LIKE '%express%' AND o_orderdate > '2024-01-01'

È anche possibile aggiungere filtri durante l'esecuzione di query o l'utilizzo di visualizzazioni metriche.

Funzionalità avanzate di modellazione

La modellazione delle visualizzazioni delle metriche supporta tecniche avanzate per creare metriche sofisticate e altamente riutilizzabili.

Joins

I join consentono di arricchire la visualizzazione delle metriche con attributi descrittivi delle tabelle correlate. È possibile utilizzare i join per modellare le relazioni dalla tabella dei fatti alle tabelle delle dimensioni (schema a stella) e per passare dalle dimensioni alle sottodimensioni. Questo consente di effettuare join su più livelli attraverso le tabelle delle dimensioni normalizzate (schema a fiocco di neve).

Consultare Usare i join nelle visualizzazioni delle metriche.

Misure della finestra

Importante

Questa funzionalità è Sperimentale.

Le misure finestra consentono di definire misure con aggregazioni finestrate, cumulative o semiadditive nelle visualizzazioni delle metriche. Questi tipi di misure consentono calcoli più complessi, ad esempio medie mobili, variazioni da periodo a periodo e totali cumulativi. Vedere Usare le misure delle finestre nelle visualizzazioni delle metriche per esempi che illustrano come usare le misure delle finestre nelle visualizzazioni delle metriche.

Componibilità

Le visualizzazioni delle metriche sono componibili, consentendo di creare logica complessa facendo riferimento a elementi definiti in precedenza. È possibile fare riferimento a dimensioni definite in precedenza nelle nuove dimensioni, fare riferimento a qualsiasi dimensione o misura definita in precedenza nelle nuove misure e fare riferimento a colonne dai join definiti nella vista delle metriche.

Vedere Componibilità nelle visualizzazioni delle metriche.

Metadati semantici

I metadati semantici consentono di utilizzare gli strumenti per comprendere come visualizzare e gestire misure e dimensioni. Sono incluse proprietà come:

Metadati semantici Example
Nomi visualizzati Total Revenue anziché sum_o_price.
Formato di visualizzazione Standardizzare la formattazione per valuta, percentuali e date.
Comments Spiegare la definizione di business della metrica nel linguaggio naturale.

Quando si definiscono i metadati semantici, questi accompagnano la metrica. Ad esempio, quando gli analisti usano Total Revenue in un dashboard, vengono automaticamente visualizzati come valuta.

Vedere Usare metadati semantici nelle visualizzazioni delle metriche.

Sintassi e formattazione YAML

Le definizioni di visualizzazione delle metriche seguono la sintassi di notazione YAML standard. Per informazioni sulla sintassi e sulla formattazione necessarie per definire una visualizzazione delle metriche, vedere Informazioni di riferimento sulla sintassi YAML . Per altre informazioni sulle specifiche YAML, vedere la documentazione relativa alla specifica YAML 1.2.2 .

Misure della finestra

Le misure finestra calcolano un valore su una finestra definita o un intervallo di righe correlate alla riga corrente. È possibile usare le misure finestra per le serie temporali e l'analisi comparativa, consentendo di definire metriche come:

  • Totale mobile di 30 giorni: somma dei ricavi degli ultimi 30 giorni
  • Ricavi da anno a data (YTD): somma cumulativa dall'inizio dell'anno
  • Confronto tra periodi precedenti: ricavi del mese precedente

Vedere Usare le misure delle finestre nelle visualizzazioni delle metriche.

Procedure consigliate per la modellazione delle visualizzazioni delle metriche

Usare le linee guida seguenti per la modellazione delle visualizzazioni delle metriche:

  • Misure atomiche del modello: Inizia definendo prima le misure più semplici e non calcolate, ad esempio SUM(revenue), COUNT(DISTINCT customer_id). Creare misure complesse (ad esempio AOV) usando la componibilità.
  • Standardizzare i valori delle dimensioni: utilizzare trasformazioni (come CASE istruzioni o espressioni) per convertire codici di database criptici in nomi aziendali chiari (ad esempio, convertire lo stato dell'ordine 'O' in 'Aperto' e 'F' in 'Evaso').
  • Definire l'ambito con i filtri: essere intenzionali sui filtri permanenti. Se una visualizzazione delle metriche deve includere solo gli ordini completati, definire tale filtro nella visualizzazione delle metriche in modo che gli utenti non possano includere accidentalmente dati incompleti.
  • Usare la denominazione semplice per l'azienda: i nomi delle metriche devono essere immediatamente riconoscibili per gli utenti aziendali (ad esempio, Valore di durata del cliente e cltv_agg_measure).
  • Dimensioni temporali separate: includere sempre dimensioni temporali granulari (ad esempio Data ordine) e dimensioni temporali troncate (ad esempio Order Month o Order Week) per supportare sia il livello di dettaglio che l'analisi delle tendenze.