Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Questa pagina illustra il modello di dati e le considerazioni usate negli esempi che illustrano come creare una visualizzazione delle metriche usando SQL o l'interfaccia utente.
Panoramica del set di dati di esempio
Gli esempi forniti in Usare SQL per creare e gestire le visualizzazioni delle metriche eCreare una visualizzazione delle metriche usando l'interfaccia utente di Esplora cataloghi usano il set di dati TPC-H, disponibile per impostazione predefinita nei set di dati del catalogo unity.
Il set di dati TPC-H è un set di dati di benchmark standard usato per valutare i sistemi di supporto delle decisioni e le prestazioni delle query. Modella un'attività della catena di approvvigionamento all'ingrosso ed è strutturata intorno a operazioni aziendali comuni, ad esempio ordini, clienti, fornitori e parti. Rappresenta un ambiente di vendita e distribuzione, in cui i clienti inseriscono ordini per parti fornite da vari fornitori in diverse nazioni e aree geografiche.
Lo schema include 8 tabelle:
REGIONeNATION: queste tabelle definiscono la posizione.CUSTOMEReSUPPLIER: queste tabelle descrivono le entità aziendali.PARTePARTSUPP: queste tabelle acquisiscono le informazioni sul prodotto e la disponibilità dei fornitori.ORDERSeLINEITEM: queste tabelle rappresentano transazioni, con elementi di riga che descrivono in dettaglio i prodotti all'interno degli ordini.
TPC-H set di dati ERD
Il diagramma seguente illustra le relazioni tra le tabelle.
Legenda:
- Le parentesi che seguono ogni nome di tabella contengono il prefisso dei nomi di colonna per tale tabella;
- Le frecce puntano nella direzione delle relazioni uno-a-molti tra tabelle.
- Il numero/formula sotto ogni nome di tabella rappresenta la cardinalità (numero di righe) della tabella. Alcuni vengono fattoriati da SF, il fattore di scala, per ottenere le dimensioni del database scelte. La cardinalità per la tabella LINEITEM è approssimativa (vedere clausola 4.2.5).
(source: TPC Benchmark H Standard Specification)
Definire una visualizzazione delle metriche
È possibile definire una visualizzazione delle metriche usando DDL SQL o l'interfaccia utente di Esplora cataloghi. In alternativa, Databricks Assistant consente di iniziare a creare la visualizzazione delle metriche. È quindi possibile modificare il DDL SQL specificato o usare l'editor di visualizzazione delle metriche nell'interfaccia utente per perfezionare la definizione suggerita.
La visualizzazione delle metriche definita per gli esempi in questa sezione è progettata per un analista di vendite o finanziari per monitorare gli indicatori di prestazioni chiave (KPI) correlati agli ordini dell'azienda. Può aiutare a rispondere a domande come:
- Come si sono evoluti nel tempo i nostri ricavi totali?
- Qual è la suddivisione corrente degli ordini in base allo stato (Open, Processing, Fulfilled)?
- Quali priorità di ordine generano il maggior numero di ricavi?
- Quanti ricavi sono attualmente "a rischio" o in sospeso (ad esempio, da Ordini aperti)?
- Qual è il fatturato medio generato per cliente univoco?
I componenti necessari sono descritti nella tabella seguente:
| Componente | Campo/espressione YAML | Significato aziendale |
|---|---|---|
| Tabella di origine | samples.tpch.orders |
Dati non elaborati contenenti i record degli ordini cliente. |
| Filter | o_orderdate > '1990-01-01' |
Concentra l'analisi solo sugli ordini effettuati dopo il 1° gennaio 1990, probabilmente escludendo i dati cronologici o archiviati. |
| Dimensione: Mese dell'ordine | (DATE_TRUNC('MONTH', o_orderdate)) |
Abilita l'analisi delle tendenze (mese su mese/anno nell'anno), verificando le variazioni delle prestazioni nel tempo. |
| Dimensione: Stato dell'ordine |
CASE istruzione che converte lo stato in Open, Processingo Fulfilled |
Consente la segmentazione in base alla fase del ciclo di vita, utile per la gestione di adempimenti e backlog. |
| Dimensione: Priorità dell'ordine |
SPLIT istruzione che formatta la priorità dell'ordine come numero |
Usato per raggruppare le prestazioni in base all'importanza strategica o all'urgenza dell'ordine. |
| Misura: Conteggio ordini | COUNT(1) |
Misura l'attività delle vendite in volume |
| Misura: Ricavi totali | SUM(o_totalprice) |
Valore delle vendite lorde di tutti gli ordini |
| Misura: Ricavi totali per cliente | SUM(o_totalprice) / COUNT(DISTINCT o_custkey) |
Metrica del valore del cliente utile per valutare la qualità delle transazioni dei clienti. |
| Misura: Ricavi totali per gli ordini aperti | SUM(o_totalprice) FILTER (WHERE o_orderstatus='O') |
Valore dei ricavi non guadagnati o dell'attuale backlog delle vendite. Usato per la previsione e la valutazione dei rischi. |
Chiedere l'assistente Databricks
Databricks Assistant consente di iniziare a definire una visualizzazione delle metriche.
- Fare clic
L'icona Assistente nell'angolo in alto a destra dell'area di lavoro di Databricks per aprire l'assistente.
- Digitare una descrizione della visualizzazione metrica che si vuole creare. L'Assistente restituisce DDL SQL che tenta di corrispondere alla richiesta.
- Copiare il codice SQL fornito e incollarlo nell'editor SQL. Fare quindi clic su Esegui.
- Modificare SQL o aprire l'editor di visualizzazione delle metriche per apportare modifiche.
Creare una nuova visualizzazione delle metriche
Usare uno degli esempi seguenti per creare una nuova visualizzazione metrica: