Teilen über


Azure Databricks-Tabellen

Azure Databricks bietet mehrere Tabellentypen und Speicherformate, um verschiedene Datenverwaltungsanforderungen zu erfüllen. In diesem Abschnitt werden verwaltete, externe und ausländische Tabellen zusammen mit den Speicherformaten Delta Lake und Apache Iceberg behandelt, die erweiterte Features wie Atomität, Konsistenz, Isolation und Haltbarkeit (ACID) sowie Zeitreisen ermöglichen.

Kernkonzepte

Lernen Sie die Grundlagen der Tabellentypen, Speicherformate und Unity Catalog-Integration kennen.

Thema BESCHREIBUNG
Tabellenkonzepte Kernkonzepte und grundlegende Informationen zu Tabellentypen, Speicherformaten und Unity-Katalogintegration.

Tabellentypen

Erkunden Sie verschiedene Tabellentypen und deren Funktionen für verschiedene Datenverwaltungsszenarien.

Tabellentyp BESCHREIBUNG
Verwaltete Tabellen Tabellen, in denen Azure Databricks Metadaten und Datendateien verwaltet. Empfohlen für neue Tabellen mit optimierter Leistung und Speicher.
externe Tabellen Tabellen, die auf daten verweisen, die in externen Speichersystemen gespeichert sind, während Metadaten im Unity-Katalog verwaltet werden.
Fremdtabellen Schreibgeschützte Tabellen, die Daten in externen Systemen darstellen, die über lakehouse Federation verbunden sind.

Speicherformate

Arbeiten Sie mit geöffneten Tabellenformaten, die erweiterte Datenverwaltungsfunktionen bieten.

Format BESCHREIBUNG
Delta Lake Standardspeicherformat, das ACID-Transaktionen, Zeitreisen und Schemaerzwingung für verwaltete und externe Tabellen bereitstellt.
Apache Iceberg Offenes Tabellenformat für die Integration in das Iceberg-Ökosystem, das erweiterte Metadatenverwaltung unterstützt.

Tabellenverwaltung

Konfigurieren und Optimieren des Tabellenverhaltens, der Struktur und der Leistung.

Merkmal BESCHREIBUNG
Tabelleneinschränkungen Definieren und Erzwingen von Datenqualitätsregeln mit Prüfeinschränkungen und nicht null-Einschränkungen.
Schemaerzwingung Steuern, wie Azure Databricks Schemaänderungen und Erzwingung von Datentypen während Schreibvorgängen verarbeitet.
Tabellenpartitionierung Organisieren Sie Daten nach Partitionsschlüsseln, um die Abfrageleistung und die Datenverwaltung zu verbessern.
Überwachung der Tabellengröße Überwachen und Analysieren von Tabellenspeichernutzungs- und Wachstumsmustern
Extern in verwaltet konvertieren Migrieren Sie externe Tabellen zu verwalteten Tabellen, um die Leistung und Verwaltung zu verbessern.
Erkennung externer Partitionen Automatisches Ermitteln und Registrieren von Partitionen in externen Tabellen, die im Cloudspeicher gespeichert sind.