Freigeben über


Was bedeutet es, eine einzelne Wahrheitsinstanz zu erstellen?

Databricks Lakehouse macht das Erstellen und Synchronisieren von Datenkopien über mehrere Systeme hinweg überflüssig, indem der Zugriff auf die Daten und deren Speicherung in einem einzigen System vereinheitlicht und das Lakehouse als einzige Wahrheitsinstanz (SSOT, Single Source of Truth) etabliert wird. Das Duplizieren von Daten führt häufig zu Datensilos, was bedeutet, dass verschiedene Teams innerhalb einer Organisation mit Versionen derselben Daten arbeiten, die sich in Qualität und Aktualität unterscheiden.

Wie werden Transaktionen und Datenzugriff durch Lakehouse?

Delta Lake-Transaktionen verwenden Protokolldateien, die zusammen mit Datendateien gespeichert sind, um ACID-Garantien auf Tabellenebene bereitzustellen. Da die Daten und Protokolldateien, die die Delta Lake-Tabellen sichern, gemeinsam in einem Cloudobjektspeicher gespeichert werden, können Daten gleichzeitig gelesen und geschrieben werden, ohne dass die Gefahr besteht, dass viele Abfragen zu Leistungseinbußen oder Deadlocks bei geschäftskritischen Workloads führen. Das bedeutet, dass Benutzer und Anwendungen in der gesamten Unternehmensumgebung auf dieselbe Kopie der Daten zugreifen können, um verschiedene Workloads zu steuern, wobei alle Betrachter garantiert die aktuellste Version der Daten zum Zeitpunkt der Ausführung ihrer Abfrage erhalten.

Verwalten des Zugriffs auf Produktionsdaten

Unity Catalog bietet eine zentralisierte Datengovernancelösung, mit der Data Stewards den Zugriff auf Benutzer, Gruppen und Dienstprinzipale differenziert steuern können. Unity Catalog steuert Berechtigungen mithilfe von Zugriffssteuerungslisten (ACLs), die sowohl Flexibilität als auch Spezifität bei der Konfiguration von Ressourcen bieten. Einige konfigurierbare Berechtigungen sind:

  • Schreibgeschützter Zugriff auf einige Tabellen
  • Berechtigungen zur Erstellung und Änderung von Tabellen für eine Datenbank
  • Die Möglichkeit, Daten an einem bestimmten Cloudspeicherort zu lesen oder zu ändern
  • Zugriff auf viele Cloudressourcen über von Unity Catalog verwaltete Speicheranmeldeinformationen

Weitere Informationen finden Sie unter Was ist Unity Catalog.

Nutzen von Ansichten im Lakehouse

Ansichten in Azure Databricks stellen gespeicherte Abfragen für Daten dar, die in Tabellen irgendwo im Lakehouse gespeichert sind. Während die Abfragen, die zu Tabellen führen, zum Zeitpunkt des Schreibens ausgeführt werden, führen Ansichten die Definitionslogik jedes Mal aus, wenn eine Abfrage für eine Ansicht ausgeführt wird. Das bedeutet, dass Ansichten einen aktuellen Zugriff auf Daten aus einer Vielzahl von Quellen bieten können und Berechnungen nur dann erfolgen, wenn die Ergebnisse aktualisiert werden müssen.

Sie können Unity Catalog verwenden, um Ansichten zusammen mit anderen Datenobjekten zu sichern und freizugeben, so dass Einzelpersonen und Teams die Logik, die wichtige Geschäftsentscheidungen trifft, innerhalb der Organisation gemeinsam nutzen können.

Weitere Informationen finden Sie unter Was ist das eine Ansicht?.

Freigeben von Daten für Projektmitarbeiter

Während die ACLs in Unity Catalog eine Vielzahl von Anwendungsfällen für die gemeinsame Nutzung von Daten innerhalb einer Unternehmensorganisation abdecken, erweitert Delta Sharing diese Möglichkeiten durch die Verwaltung des schreibgeschützten Zugriffs auf Datensätze, die beliebig mit Projektmitarbeitern geteilt werden können. Zu den von Unity Catalog unterstützten Anwendungsfällen gehören:

  • Bereitstellung von Echtzeitzugriff auf regionale Analysen für isolierte Regionen multinationaler Unternehmen
  • Gemeinsame Nutzung von Datasets zwischen isolierten Geschäftsbereichen, die unter demselben Unternehmensdach vorhanden sind
  • Sicherer Zugriff auf von Kunden kuratierte Datasets für Drittparteien

In Azure Databricks ist Delta Sharing bereits in Unity Catalog integriert, ist aber auch Teil von Open Source Delta Lake. Weitere Informationen finden Sie unter Was ist Delta Sharing?.