Freigeben über


Tabellen und Ansichten in Azure Databricks

Dieser Artikel bietet eine Übersicht über Tabellen, Ansichten, Streamingtabellen und materialisierte Ansichten in Azure Databricks.

Tabelle

Eine Tabelle ist ein strukturiertes Dataset, das an einem bestimmten Ort gespeichert ist. Der in Azure Databricks erstellte Standardtabellentyp ist eine verwaltete Unity-Katalogtabelle. Tabellen können mithilfe von SQL-Befehlen oder DataFrame-APIs abgefragt und bearbeitet werden, um Vorgänge wie INSERT, UPDATE, DELETE und MERGE INTO. Siehe Einführung in Azure Databricks-Tabellen

Ansehen

Eine Ansicht ist eine virtuelle Tabelle, die durch eine Abfrage definiert wird, die keine Daten speichert und Daten aus einer oder mehreren Tabellen in einem bestimmten Format oder einer bestimmten Abstraktion darstellen kann. Ansichten sind nützlich, um komplexe Abfragen zu vereinfachen, Geschäftslogik zu kapseln und eine konsistente Schnittstelle zu den zugrunde liegenden Daten bereitzustellen, ohne Speicher zu duplizieren. Was ist eine Ansicht?

Materialisierte Ansicht

Ähnlich wie bei einer Ansicht wird eine materialisierte Ansicht durch eine Abfrage definiert. Im Gegensatz zu einer Ansicht wird jedoch eine materialisierte Ansicht vorkompiliert und speichert das Ergebnis der Abfrage. Abfragen können schneller für die materialisierte Ansicht als Ansichten ausgeführt werden, nehmen aber zusätzlichen Speicher in Anspruch. Mit Databricks SQL können Sie eine eigenständige materialisierte Ansicht erstellen und aktualisieren oder Lakeflow Declarative Pipelines verwenden, um eine oder mehrere materialisierte Ansichten, Streamingtabellen und Ansichten zu erstellen und zu aktualisieren. Siehe Verwenden materialisierter Ansichten in Databricks SQL - und materialisierten Ansichten.

Streamingtabelle

Eine Streamingtabelle ist eine Art von verwalteter Unity-Katalog-Tabelle, die die Verarbeitungslogik mithilfe von Flüssen enthält, um sie zu definieren. Mit Databricks SQL können Sie eine eigenständige Streamingtabelle erstellen und aktualisieren oder Lakeflow Declarative Pipelines verwenden, um eine oder mehrere Streamingtabellen, materialisierte Ansichten und Ansichten zu erstellen und zu aktualisieren. Siehe Verwenden von Streamingtabellen in Databricks SQL - und Streamingtabellen.

Materialisierte Ansicht im Vergleich zur Streamingtabelle

Materialisierte Ansichten und Streamingtabellen sind zwei allgemeine Datenobjekte, die für das Daten engineering verwendet werden. Materialisierte Ansichten verwenden Batchsemantik und Streamingtabellen verwenden Streamingsemantik. Einen Vergleich zwischen Batch und Streaming sowie Überlegungen zur Auswahl für Ihre Data Engineering-Workloads finden Sie unter Batch- und Streamingdatenverarbeitung in Azure Databricks.