Grundlegendes zu Datamarts

In diesem Artikel werden wichtige Konzepte zum Verständnis von Datamarts beschrieben und erläutert.

Datamarts bieten eine semantische Ebene, die automatisch generiert und mit dem Inhalt der Tabellen im Datamart, ihrer Struktur und den zugrunde liegenden Daten synchronisiert wird, die alle in einem automatisch generierten Dataset enthalten sind. Diese automatische Generierung und Synchronisierung ermöglicht Ihnen, die Domäne der Daten weiter zu beschreiben, z. B. durch Hierarchien, Anzeigenamen und Beschreibungen, sowie Formatierungen festzulegen, die für Ihr Gebietsschema oder Ihre geschäftlichen Anforderungen gelten. Mit Datamarts können Sie auch Kennzahlen und standardisierte Metriken für die Berichterstellung erstellen. Power BI (und andere Clienttools) können Visuals erstellen und Ergebnisse für solche Berechnungen basierend auf den Daten im Kontext bereitstellen.

Das automatisch generierte Power BI-Dataset, das anhand eines Datamarts erstellt wird, macht das Herstellen einer Verbindung mit einem separaten Dataset, Einrichten von Aktualisierungszeitplänen und Verwalten mehrerer Datenelemente überflüssig. Stattdessen können Sie Ihre Geschäftslogik in einem Datamart erstellen, dessen Daten sofort in Power BI zur Verfügung stehen, wodurch sich folgende Möglichkeiten ergeben:

  • Zugriff auf Daten im Datamart über den Dataset-Hub
  • Funktionalität zum Analysieren in Excel
  • Funktionalität zum schnellen Erstellen von Berichten im Power BI-Dienst
  • Aktualisierungen, Datensynchronisierungen oder Verständnis der Verbindungsdetails nicht erforderlich
  • Erstellen von Lösungen im Web ohne Notwendigkeit von Power BI Desktop

In der Vorschauphase ist die automatisch generierte Datasetkonnektivität nur mit DirectQuery verfügbar. Die folgende Abbildung zeigt, wie sich Datamarts in den Prozess einfügen, angefangen beim Herstellen von Verbindungen mit Daten bis zum Erstellen von Berichten.

Diagramm, das zeigt, wie sich Datamarts in den Prozess der Datenverbindung und -analyse einfügen.

Automatisch generierte Datasets unterscheiden sich von herkömmlichen Power BI-Datasets auf folgende Weise.

Der XMLA-Endpunkt unterstützt schreibgeschützte Vorgänge, und Benutzer können das Dataset nicht direkt bearbeiten. Die automatisch generierten Datasets verfügen nicht über Datenquelleneinstellungen, und Benutzer müssen keine Anmeldeinformationen eingeben. Stattdessen verwenden sie für Abfragen automatisches Single Sign-On (SSO, einmaliges Anmelden). Für Aktualisierungsvorgänge verwenden Datasets die Anmeldeinformationen des Erstellers des Datasets, um sich mit dem SQL-Endpunkt des verwalteten Datamarts zu verbinden.

Mit Power BI Desktop können Benutzer zusammengesetzte Modelle erstellen, die es Ihnen ermöglichen, sich mit dem Dataset des Datamarts zu verbinden und Folgendes auszuführen:

  • Auswählen bestimmter zu analysierender Tabellen
  • Hinzufügen weiterer Datenquellen

Wenn Sie schließlich das automatisch generierte Dataset nicht direkt verwenden möchten, können Sie eine Verbindung mit dem SQL-Endpunkt des Datamarts herstellen. Weitere Informationen finden Sie unter Erstellen von Berichten mithilfe von Datamarts.

Grundlegendes zu inkrementellen Aktualisierungen und Datamarts

Mit dem Datamart-Editor können Sie inkrementelle Aktualisierungen von Daten erstellen und ändern, vergleichbar mit Dataflows und der inkrementellen Aktualisierung von Datasets. Die inkrementelle Aktualisierung erweitert geplante Aktualisierungsvorgänge, indem sie die automatische Erstellung und Verwaltung von Partitionen für Tabellen im Datamart ermöglicht, die häufig neue und aktualisierte Daten laden.

Bei den meisten Datamarts betrifft die inkrementelle Aktualisierung eine oder mehrere Tabellen, die sich häufig ändernde und exponentiell zunehmende Transaktionsdaten enthalten, wie z. B. eine Faktentabelle in einem relationalen oder sternförmigen Datenbankschema. Wenn Sie eine Richtlinie zur inkrementellen Aktualisierung der Tabelle befolgen und nur die neuesten Importpartitionen aktualisieren, können Sie die Menge der zu aktualisierenden Daten erheblich reduzieren.

Inkrementelle Aktualisierung und Echtzeitdaten für Datamarts bieten die folgenden Vorteile:

  • Weniger Aktualisierungszyklen bei sich schnell ändernden Daten
  • Schnellere Aktualisierungen
  • Zuverlässigere Aktualisierungen
  • Reduzierter Ressourcenverbrauch
  • Möglichkeit des Erstellens großer Datamarts
  • Ist einfach zu konfigurieren

Grundlegendes zum proaktiven Zwischenspeichern

Proaktives Zwischenspeichern ermöglicht den automatischen Import der zugrunde liegenden Daten für das automatisch generierte Dataset, sodass Sie den Speichermodus nicht verwalten oder orchestrieren müssen. Der Importmodus für das automatisch generierte Dataset bietet Leistungsbeschleunigung für das Dataset des Datamarts durch das schnelle Vertipaq-Modul. Mithilfe des proaktiven Zwischenspeicherns ändert Power BI den Speichermodus Ihres Modells in „Import“, der das In-Memory-Modul in Power BI und Analysis Services verwendet.

Proaktives Zwischenspeichern funktioniert auf folgende Weise: Nach jeder Aktualisierung wird der Speichermodus für das automatisch generierte Dataset in DirectQuery geändert. Proaktives Zwischenspeichern erstellt asynchron ein paralleles Importmodell und wird vom Datamart verwaltet, ohne die Verfügbarkeit oder Leistung des Datamarts zu beeinträchtigen. Abfragen, die nach Abschluss des automatisch generierten Datasets eingehen, verwenden das Importmodell.

Die automatische Generierung des Importmodells erfolgt innerhalb von etwa zehn Minuten, nachdem keine Änderungen im Datamart festgestellt wurden. Änderungen an dem Importdataset umfassen Folgendes:

  • Refreshes
  • Neue Datenquellen
  • Schemaänderungen:
    • Neue Datenquellen
    • Aktualisierungen der Datenvorbereitungsschritte in Power Query Online
  • Alle Modellierungsaktualisierungen, wie etwa:
    • Measures
    • Hierarchien
    • Beschreibungen

Best Practices für proaktives Zwischenspeichern

Verwenden Sie Bereitstellungspipelines für Änderungen, um die beste Leistung sicherzustellen und zudem sicherzustellen, dass Benutzer das Importmodell verwenden. Die Verwendung von Bereitstellungspipelines ist bereits eine Best Practice zum Erstellen von Datamarts, aber dadurch wird sichergestellt, dass das proaktive Zwischenspeichern häufiger genutzt wird.

Überlegungen und Einschränkungen für das proaktive Zwischenspeichern

  • Power BI begrenzt derzeit die Dauer von Zwischenspeichervorgängen auf zehn Minuten.
  • Beschränkungen der Eindeutigkeit/Nicht-Null für bestimmte Spalten werden im Importmodell durchgesetzt, und der Cacheaufbau schlägt fehl, wenn die Daten nicht konform sind.

Nächste Schritte

Dieser Artikel bot eine Übersicht über wichtige Konzepte von Datamarts, die Sie verstehen sollten.

In den folgenden Artikeln finden Sie weitere Informationen zu Datamarts und Power BI:

Weitere Informationen zu Dataflows und zum Transformieren von Daten finden Sie in den folgenden Artikeln: