Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Dieser Artikel bietet eine Übersicht über Tabellen, Ansichten, Streamingtabellen und materialisierte Ansichten in Azure Databricks.
Tabelle
Eine Tabelle ist ein strukturiertes Dataset, das an einem bestimmten Ort gespeichert ist. Der in Azure Databricks erstellte Standardtabellentyp ist eine verwaltete Unity-Katalogtabelle. Tabellen können mithilfe von SQL-Befehlen oder DataFrame-APIs abgefragt und bearbeitet werden, um Vorgänge wie INSERT
, UPDATE
, DELETE
und MERGE INTO
. Siehe Einführung in Azure Databricks-Tabellen
Ansehen
Eine Ansicht ist eine virtuelle Tabelle, die durch eine Abfrage definiert wird, die keine Daten speichert und Daten aus einer oder mehreren Tabellen in einem bestimmten Format oder einer bestimmten Abstraktion darstellen kann. Ansichten sind nützlich, um komplexe Abfragen zu vereinfachen, Geschäftslogik zu kapseln und eine konsistente Schnittstelle zu den zugrunde liegenden Daten bereitzustellen, ohne Speicher zu duplizieren. Was ist eine Ansicht?
Materialisierte Ansicht
Ähnlich wie bei einer Ansicht wird eine materialisierte Ansicht durch eine Abfrage definiert. Im Gegensatz zu einer Ansicht wird jedoch eine materialisierte Ansicht vorkompiliert und speichert das Ergebnis der Abfrage. Abfragen können schneller für die materialisierte Ansicht als Ansichten ausgeführt werden, nehmen aber zusätzlichen Speicher in Anspruch. Mit Databricks SQL können Sie eine eigenständige materialisierte Ansicht erstellen und aktualisieren oder Lakeflow Declarative Pipelines verwenden, um eine oder mehrere materialisierte Ansichten, Streamingtabellen und Ansichten zu erstellen und zu aktualisieren. Siehe Verwenden materialisierter Ansichten in Databricks SQL - und materialisierten Ansichten.
Streamingtabelle
Eine Streamingtabelle ist eine Art von verwalteter Unity-Katalog-Tabelle, die die Verarbeitungslogik mithilfe von Flüssen enthält, um sie zu definieren. Mit Databricks SQL können Sie eine eigenständige Streamingtabelle erstellen und aktualisieren oder Lakeflow Declarative Pipelines verwenden, um eine oder mehrere Streamingtabellen, materialisierte Ansichten und Ansichten zu erstellen und zu aktualisieren. Siehe Verwenden von Streamingtabellen in Databricks SQL - und Streamingtabellen.
Materialisierte Ansicht im Vergleich zur Streamingtabelle
Materialisierte Ansichten und Streamingtabellen sind zwei allgemeine Datenobjekte, die für das Daten engineering verwendet werden. Materialisierte Ansichten verwenden Batchsemantik und Streamingtabellen verwenden Streamingsemantik. Einen Vergleich zwischen Batch und Streaming sowie Überlegungen zur Auswahl für Ihre Data Engineering-Workloads finden Sie unter Batch- und Streamingdatenverarbeitung in Azure Databricks.