Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Auf dieser Seite werden das Datenmodell und die in den Beispielen verwendeten Überlegungen erläutert, wie eine Metrikansicht mit SQL oder der Benutzeroberfläche erstellt wird.
Übersicht über das Beispiel-Dataset
Die beispiele in Use SQL zum Erstellen und Verwalten von Metrikansichten und Erstellen einer Metrikansicht mithilfe der Benutzeroberfläche des Katalog-Explorers verwenden das TPC-H-Dataset, das standardmäßig in Unity-Katalog-Datasets verfügbar ist.
Das TPC-H-Dataset ist ein Standard-Benchmark-Dataset, das verwendet wird, um Entscheidungsunterstützungssysteme und Abfrageleistung zu bewerten. Sie modelliert ein Großhandels-Lieferkettengeschäft und ist rund um gemeinsame Geschäftsvorgänge wie Aufträge, Kunden, Lieferanten und Teile strukturiert. Sie stellt eine Vertriebs- und Vertriebsumgebung dar, in der Kunden Aufträge für Teile aufgeben, die von verschiedenen Lieferanten in verschiedenen Nationen und Regionen geliefert werden.
Das Schema enthält 8 Tabellen:
REGIONundNATION: Diese Tabellen definieren den Speicherort.CUSTOMERundSUPPLIER: Diese Tabellen beschreiben Geschäftsentitäten.PARTundPARTSUPP: Diese Tabellen erfassen Produktinformationen und Lieferantenverfügbarkeit.ORDERSundLINEITEM: Diese Tabellen repräsentieren Transaktionen, mit Posten, die Produkte innerhalb von Bestellungen detailliert darstellen.
TPC-H-Datensatz ERD
Im folgenden Diagramm werden die Beziehungen zwischen den Tabellen erläutert.
Legende:
- Die Klammern nach jedem Tabellennamen enthalten das Präfix der Spaltennamen für diese Tabelle.
- Die Pfeile zeigen die Richtung der 1:n-Beziehungen zwischen den Tabellen an.
- Die Zahl/Formel unter jedem Tabellennamen stellt die Kardinalität (Anzahl der Zeilen) der Tabelle dar. Einige werden mit SF, dem Skalierungsfaktor, multipliziert, um die gewählte Datenbankgröße zu erhalten. Die Kardinalität für die LINEITEM-Tabelle ist ungefähr (siehe Klausel 4.2.5).
(Quelle: TPC Benchmark H Standard Specification)
Definieren einer Metrikansicht
Sie können eine Metrikansicht mithilfe von SQL DDL oder der Benutzeroberfläche des Katalog-Explorers definieren. Alternativ kann der Databricks-Assistent Ihnen bei den ersten Schritten beim Erstellen Ihrer Metrikansicht helfen. Anschließend können Sie die bereitgestellte SQL-DDL bearbeiten oder den metrischen Ansichts-Editor in der Benutzeroberfläche verwenden, um die vorgeschlagene Definition zu verfeinern.
Die metrikbezogene Ansicht, die für die Beispiele in diesem Abschnitt definiert ist, ist für einen Vertriebs- oder Finanzanalysten vorgesehen, um key Performance Indicators (KPIs) im Zusammenhang mit den Aufträgen des Unternehmens zu überwachen. Es kann ihnen helfen, Fragen wie:
- Wie hat sich unser Gesamtumsatz im Laufe der Zeit trendet?
- Was ist die aktuelle Aufschlüsselung unserer Aufträge nach Status (Offen, Verarbeitung, Erfüllt)?
- Welche Auftragsprioritäten generieren die meisten Einnahmen?
- Wie viel Umsatz ist derzeit "gefährdet" oder offen (d. h. aus Open-Aufträgen)?
- Was ist der durchschnittliche Umsatz pro eindeutigen Kunden?
Die erforderlichen Komponenten werden in der folgenden Tabelle beschrieben:
| Komponente | YAML-Feld/Ausdruck | Geschäftliche Bedeutung |
|---|---|---|
| Quellentabelle | samples.tpch.orders |
Die Rohdaten, die Kundenauftragsdatensätze enthalten. |
| Filter | o_orderdate > '1990-01-01' |
Konzentriert sich nur auf Aufträge, die nach dem 1. Januar 1990 getätigt wurden, wobei wahrscheinlich historische oder archivierte Daten ausgeschlossen werden. |
| Dimension: Bestellmonat | (DATE_TRUNC('MONTH', o_orderdate)) |
Ermöglicht die Trendanalyse (Monat über Monat/Jahr über Jahr), und verfolgt, wie sich die Leistung im Laufe der Zeit ändert. |
| Dimension: Bestellstatus |
CASE-Anweisung, die den Status in Open, Processing oder Fulfilled übersetzt |
Ermöglicht die Segmentierung nach Lebenszyklusstufe, die für die Erfüllung und das Backlog-Management hilfreich ist. |
| Dimension: Auftragspriorität |
SPLIT Anweisung, die die Reihenfolgepriorität als Zahl formatiert |
Wird verwendet, um die Leistung nach der strategischen Wichtigkeit oder Dringlichkeit der Bestellung zu gruppieren. |
| Measure: Bestellanzahl | COUNT(1) |
Misst die Volumenumsatzaktivität |
| Maß: Gesamtumsatz | SUM(o_totalprice) |
Der Bruttoumsatzwert aller Bestellungen |
| Kennzahl: Gesamtumsatz pro Kunde | SUM(o_totalprice) / COUNT(DISTINCT o_custkey) |
Eine Kundenwertmetrik, die für die Bewertung der Kundentransaktionsqualität nützlich ist. |
| Measure: Gesamtumsatz für Offene Aufträge | SUM(o_totalprice) FILTER (WHERE o_orderstatus='O') |
Der Wert des nicht verdienten Umsatzes oder des aktuellen Verkaufsrückstands. Wird für Prognose und Risikobewertung verwendet. |
Fragen Sie Databricks-Assistent
Der Databricks-Assistent kann Ihnen bei den ersten Schritten beim Definieren einer Metrikansicht helfen.
- Klicken Sie auf
im oberen rechten Bereich Ihres Databricks-Arbeitsbereichs, um den Assistenten zu öffnen.
- Geben Sie eine Beschreibung der Metrikansicht ein, die Sie erstellen möchten. Der Assistent gibt SQL DDL zurück, die versucht, Ihre Anforderung abzugleichen.
- Kopieren Sie die bereitgestellte SQL-Datei, und fügen Sie sie in den SQL-Editor ein. Klicken Sie dann auf "Ausführen".
- Bearbeiten Sie sql, oder öffnen Sie den metrischen Ansichts-Editor, um Anpassungen vorzunehmen.
Erstellen einer neuen Metrikansicht
Verwenden Sie eines der folgenden Beispiele, um eine neue Metrikansicht zu erstellen: