Beschreiben der grundlegenden Konzepte der Datenmodellierung
Mit analytischen Modellen können Sie Daten strukturieren, um die Analyse zu unterstützen. Modelle basieren auf verknüpften Datentabellen und definieren die numerischen Werte, die Sie analysieren oder dokumentieren möchten (als Measures bekannt), und die Entitäten, nach denen Sie sie aggregieren möchten (als Dimensionen bekannt). Ein Modell kann z. B. eine Tabelle mit numerischen Measures für Verkäufe (z. B. Umsatz oder Menge) und Dimensionen für Produkte, Kunden und Zeit enthalten. Auf diese Weise können Sie Measures zum Verkauf über eine oder mehrere Dimensionen hinweg aggregieren (z. B. um den Gesamtumsatz nach Kunde oder die gesamten verkauften Artikel nach Produkt pro Monat zu identifizieren). Konzeptionell bildet das Modell eine mehrdimensionale Struktur, die häufig als Cube bezeichnet wird, wobei jeder Punkt, an dem sich die Dimensionen überschneiden, ein aggregiertes Measure für diese Dimensionen darstellt.)
Hinweis
Obwohl wir ein Analysemodell häufig als Cube bezeichnen, kann es mehr (oder weniger) als drei Dimensionen geben– es ist nur nicht einfach für uns, mehr als drei zu visualisieren!
Tabellen und Schema
Dimensionstabellen stellen die Entitäten dar, mit denen Sie numerische Measures aggregieren möchten, z. B. Produkt oder Kunde. Jede Entität wird durch eine Zeile mit einem eindeutigen Schlüsselwert dargestellt. Die verbleibenden Spalten stellen Attribute einer Entität dar, z. B. haben Produkte Namen und Kategorien, und Kunden haben Adressen und Städte. In den meisten analytischen Modellen ist es üblich, eine Zeitdimension einzubeziehen, sodass Sie numerische Measures, die Ereignissen zugeordnet sind, zeitlich aggregieren können.
Die numerischen Measures, die von den verschiedenen Dimensionen im Modell aggregiert werden, werden in Faktentabellen gespeichert. Jede Zeile in einer Faktentabelle stellt ein aufgezeichnetes Ereignis dar, dem numerische Measures zugeordnet sind. Die Tabelle Sales im folgenden Schema stellt z. B. Verkaufstransaktionen für einzelne Artikel dar und enthält numerische Werte für verkaufte Menge und Umsatz.
Diese Art von Schema, bei dem eine Faktentabelle mit einer oder mehreren Dimensionstabellen verknüpft ist, wird als Sternschema bezeichnet (stellen Sie sich vor, es gibt fünf Dimensionen, die mit einer einzelnen Faktentabelle verknüpft sind – das Schema würde einen fünfzackigen Stern bilden!). Sie können auch ein komplexeres Schema definieren, in dem Dimensionstabellen mit zusätzlichen Tabellen verknüpft sind, die weitere Details enthalten (z. B. können Sie Attribute von Produktkategorien in einer separaten Kategorietabelle darstellen, die mit der Produkttabelle verknüpft ist. In diesem Fall wird der Entwurf als Schneeflockenschema bezeichnet. Das Schema der Fakten- und Dimensionstabellen wird verwendet, um ein analytisches Modell zu erstellen, in dem Measureaggregationen für alle Dimensionen vorab berechnet werden. Im Vergleich zu einem Szenario, in dem die Aggregationen jedes Mal berechnet werden, wird damit die Leistung von Analyse- und Berichterstellungsaktivitäten erheblich gesteigert.)
Attributhierarchien
Ein letzter Punkt, der bei Analysemodellen in Betracht gezogen werden sollte, ist die Erstellung von Attributhierarchien, mit denen Sie schnell einen Drillup oder Drilldown ausführen können, um aggregierte Werte auf verschiedenen Ebenen in einer hierarchischen Dimension zu finden. Betrachten Sie beispielsweise die Attribute in den Dimensionstabellen, die wir bisher besprochen haben. In der Product-Tabelle können Sie eine Hierarchie erstellen, in der jede Kategorie mehrere benannte Produkte enthalten kann. Auf ähnliche Weise kann in der Customer-Tabelle eine Hierarchie erstellt werden, um mehrere benannte Kunden in jeder Stadt darzustellen. Schließlich können Sie in der Time-Tabelle eine Hierarchie aus Jahr, Monat und Tag bilden. Das Modell kann mit vorab aggregierten Werten für jede Ebene einer Hierarchie erstellt werden, sodass Sie den Umfang Ihrer Analyse schnell ändern können, z. B. indem Sie den Gesamtumsatz nach Jahr anzeigen und dann einen Drilldown ausführen, um eine detailliertere Aufschlüsselung des Gesamtumsatzes nach Monat zu erhalten.
Analysemodellerstellung in Microsoft Power BI
Sie können Power BI verwenden, um ein Analysemodell aus Datentabellen zu definieren, die aus einer oder mehreren Datenquellen importiert werden können. Anschließend können Sie die Datenmodellierungsschnittstelle auf der Registerkarte Modell von Power BI Desktop verwenden, um Ihr Analysemodell zu definieren, indem Sie Beziehungen zwischen Fakten- und Dimensionstabellen erstellen, Hierarchien definieren, Datentypen und Anzeigeformate für Felder in den Tabellen festlegen und andere Eigenschaften Ihrer Daten verwalten, die dabei helfen, ein umfangreiches Modell für die Analyse zu definieren.