Anmerkung
Der Zugriff auf diese Seite erfordert eine Genehmigung. Du kannst versuchen, dich anzumelden oder die Verzeichnisse zu wechseln.
Der Zugriff auf diese Seite erfordert eine Genehmigung. Du kannst versuchen , die Verzeichnisse zu wechseln.
Azure Databricks bietet mehrere Tabellentypen und Speicherformate, um verschiedene Datenverwaltungsanforderungen zu erfüllen. In diesem Abschnitt werden verwaltete, externe und ausländische Tabellen zusammen mit den Speicherformaten Delta Lake und Apache Iceberg behandelt, die erweiterte Features wie Atomität, Konsistenz, Isolation und Haltbarkeit (ACID) sowie Zeitreisen ermöglichen.
Kernkonzepte
Lernen Sie die Grundlagen der Tabellentypen, Speicherformate und Unity Catalog-Integration kennen.
| Thema | BESCHREIBUNG |
|---|---|
| Tabellenkonzepte | Kernkonzepte und grundlegende Informationen zu Tabellentypen, Speicherformaten und Unity-Katalogintegration. |
Tabellentypen
Erkunden Sie verschiedene Tabellentypen und deren Funktionen für verschiedene Datenverwaltungsszenarien.
| Tabellentyp | BESCHREIBUNG |
|---|---|
| Verwaltete Tabellen | Tabellen, in denen Azure Databricks Metadaten und Datendateien verwaltet. Empfohlen für neue Tabellen mit optimierter Leistung und Speicher. |
| externe Tabellen | Tabellen, die auf daten verweisen, die in externen Speichersystemen gespeichert sind, während Metadaten im Unity-Katalog verwaltet werden. |
| Fremdtabellen | Schreibgeschützte Tabellen, die Daten in externen Systemen darstellen, die über lakehouse Federation verbunden sind. |
Speicherformate
Arbeiten Sie mit geöffneten Tabellenformaten, die erweiterte Datenverwaltungsfunktionen bieten.
| Format | BESCHREIBUNG |
|---|---|
| Delta Lake | Standardspeicherformat, das ACID-Transaktionen, Zeitreisen und Schemaerzwingung für verwaltete und externe Tabellen bereitstellt. |
| Apache Iceberg | Offenes Tabellenformat für die Integration in das Iceberg-Ökosystem, das erweiterte Metadatenverwaltung unterstützt. |
Tabellenverwaltung
Konfigurieren und Optimieren des Tabellenverhaltens, der Struktur und der Leistung.
| Merkmal | BESCHREIBUNG |
|---|---|
| Tabelleneinschränkungen | Definieren und Erzwingen von Datenqualitätsregeln mit Prüfeinschränkungen und nicht null-Einschränkungen. |
| Schemaerzwingung | Steuern, wie Azure Databricks Schemaänderungen und Erzwingung von Datentypen während Schreibvorgängen verarbeitet. |
| Tabellenpartitionierung | Organisieren Sie Daten nach Partitionsschlüsseln, um die Abfrageleistung und die Datenverwaltung zu verbessern. |
| Überwachung der Tabellengröße | Überwachen und Analysieren von Tabellenspeichernutzungs- und Wachstumsmustern |
| Extern in verwaltet konvertieren | Migrieren Sie externe Tabellen zu verwalteten Tabellen, um die Leistung und Verwaltung zu verbessern. |
| Erkennung externer Partitionen | Automatisches Ermitteln und Registrieren von Partitionen in externen Tabellen, die im Cloudspeicher gespeichert sind. |