Condividi tramite


Tabelle di Azure Databricks

Azure Databricks offre più tipi di tabella e formati di archiviazione per soddisfare esigenze di gestione dei dati diverse. Questa sezione illustra tabelle gestite, esterne ed esterne, insieme ai formati di archiviazione Delta Lake e Apache Iceberg che supportano funzionalità avanzate come Atomicità, Coerenza, Isolamento e Durabilità (ACID) e il viaggio in tempo.

Concetti principali

Informazioni sui concetti fondamentali sui tipi di tabella, i formati di archiviazione e l'integrazione del catalogo Unity.

Argomento Description
Concetti relativi alle tabelle Concetti di base e informazioni fondamentali sui tipi di tabella, i formati di archiviazione e l'integrazione del catalogo Unity.

Tipi di tabella

Esplorare i diversi tipi di tabella e le relative funzionalità per vari scenari di gestione dei dati.

Tipo di tabella Description
Tabelle gestite di Unity Catalog in Azure Databricks per Delta Lake e Apache Iceberg Azure Databricks gestisce i metadati e i file di dati. Usato per le nuove tabelle che richiedono prestazioni ottimizzate.
Tabelle temporanee Tabelle gestite del Catalogo Unity con ambito a livello di sessione per i dati intermedi. Solo SQL warehouse.
Usare tabelle esterne Dati archiviati in sistemi esterni. Unity Catalog gestisce solo i metadati.
Usare tabelle esterne Accesso in sola lettura ai dati nei sistemi esterni connessi tramite Lakehouse Federation.

Formati di archiviazione

Usare formati di tabella aperti che offrono funzionalità avanzate di gestione dei dati.

Formato Description
Delta Lake Il formato di archiviazione predefinito fornisce transazioni ACID, tempo di spostamento e imposizione dello schema per le tabelle gestite ed esterne.
Apache Iceberg Formato di tabella aperto per l'integrazione con l'ecosistema Iceberg, che supporta la gestione avanzata dei metadati.

Gestione tabelle

Configurare e ottimizzare il comportamento, la struttura e le prestazioni delle tabelle.

Caratteristica / Funzionalità Description
Vincoli di tabella Definire e applicare regole di qualità dei dati con vincoli CHECK e non vincoli Null.
Imposizione dello schema Controllare in che modo Azure Databricks gestisce le modifiche dello schema e l'imposizione del tipo di dati durante le scritture.
Partizionamento delle tabelle Organizzare i dati in base alle chiavi di partizione per migliorare le prestazioni delle query e la gestione dei dati.
Monitoraggio delle dimensioni delle tabelle Monitorare e analizzare i modelli di utilizzo e crescita dell'archiviazione tabelle.
Convertire l'esterno in gestito Eseguire la migrazione di tabelle esterne a tabelle gestite per migliorare le prestazioni e la gestione.
Individuazione partizione esterna Individuare e registrare automaticamente le partizioni in tabelle esterne archiviate nell'archiviazione cloud.