Freigeben über


Azure Databricks-Tabellen

Azure Databricks bietet mehrere Tabellentypen und Speicherformate, um verschiedene Datenverwaltungsanforderungen zu erfüllen. In diesem Abschnitt werden verwaltete, externe und ausländische Tabellen zusammen mit den Speicherformaten Delta Lake und Apache Iceberg behandelt, die erweiterte Features wie Atomität, Konsistenz, Isolation und Haltbarkeit (ACID) sowie Zeitreisen ermöglichen.

Kernkonzepte

Lernen Sie die Grundlagen der Tabellentypen, Speicherformate und Unity Catalog-Integration kennen.

Thema BESCHREIBUNG
Tabellenkonzepte Kernkonzepte und grundlegende Informationen zu Tabellentypen, Speicherformaten und Unity-Katalogintegration.

Tabellentypen

Erkunden Sie verschiedene Tabellentypen und deren Funktionen für verschiedene Datenverwaltungsszenarien.

Tabellentyp BESCHREIBUNG
Verwaltete Tabellen im Unity-Katalog in Azure Databricks für Delta Lake und Apache Iceberg Azure Databricks verwaltet Metadaten und Datendateien. Wird für neue Tabellen verwendet, die eine optimierte Leistung erfordern.
Temporäre Tabellen Sitzungsbezogen verwaltete Unity-Katalog-Tabellen für Zwischendaten. Nur SQL-Lager.
Arbeiten mit externen Tabellen Daten, die in externen Systemen gespeichert sind. Unity-Katalog verwaltet nur Metadaten.
Arbeiten mit Fremdtabellen Schreibgeschützter Zugriff auf Daten in externen Systemen, die über Lakehouse Federation verbunden sind.

Speicherformate

Arbeiten Sie mit geöffneten Tabellenformaten, die erweiterte Datenverwaltungsfunktionen bieten.

Format BESCHREIBUNG
Delta Lake Standardspeicherformat, das ACID-Transaktionen, Zeitreisen und Schemaerzwingung für verwaltete und externe Tabellen bereitstellt.
Apache Iceberg Offenes Tabellenformat für die Integration in das Iceberg-Ökosystem, das erweiterte Metadatenverwaltung unterstützt.

Tabellenverwaltung

Konfigurieren und Optimieren des Tabellenverhaltens, der Struktur und der Leistung.

Merkmal BESCHREIBUNG
Tabelleneinschränkungen Definieren und Erzwingen von Datenqualitätsregeln mit Prüfeinschränkungen und nicht null-Einschränkungen.
Schemaerzwingung Steuern, wie Azure Databricks Schemaänderungen und Erzwingung von Datentypen während Schreibvorgängen verarbeitet.
Tabellenpartitionierung Organisieren Sie Daten nach Partitionsschlüsseln, um die Abfrageleistung und die Datenverwaltung zu verbessern.
Überwachung der Tabellengröße Überwachen und Analysieren von Tabellenspeichernutzungs- und Wachstumsmustern
Extern in verwaltet konvertieren Migrieren Sie externe Tabellen zu verwalteten Tabellen, um die Leistung und Verwaltung zu verbessern.
Erkennung externer Partitionen Automatisches Ermitteln und Registrieren von Partitionen in externen Tabellen, die im Cloudspeicher gespeichert sind.