Condividi tramite


Tabelle di Azure Databricks

Azure Databricks offre più tipi di tabella e formati di archiviazione per soddisfare esigenze di gestione dei dati diverse. Questa sezione illustra tabelle gestite, esterne ed esterne, insieme ai formati di archiviazione Delta Lake e Apache Iceberg che supportano funzionalità avanzate come Atomicità, Coerenza, Isolamento e Durabilità (ACID) e il viaggio in tempo.

Concetti principali

Informazioni sui concetti fondamentali sui tipi di tabella, i formati di archiviazione e l'integrazione del catalogo Unity.

Argomento Description
Concetti relativi alle tabelle Concetti di base e informazioni fondamentali sui tipi di tabella, i formati di archiviazione e l'integrazione del catalogo Unity.

Tipi di tabella

Esplorare i diversi tipi di tabella e le relative funzionalità per vari scenari di gestione dei dati.

Tipo di tabella Description
Tabelle gestite Tabelle in cui Azure Databricks gestisce sia i metadati che i file di dati. Consigliato per le nuove tabelle con prestazioni e archiviazione ottimizzate.
tabelle esterne Tabelle che fanno riferimento ai dati archiviati in sistemi di archiviazione esterni durante la gestione dei metadati nel catalogo Unity.
Tabelle esterne Tabelle di sola lettura che rappresentano i dati nei sistemi esterni connessi tramite Lakehouse Federation.

Formati di archiviazione

Usare formati di tabella aperti che offrono funzionalità avanzate di gestione dei dati.

Formato Description
Delta Lake Il formato di archiviazione predefinito fornisce transazioni ACID, tempo di spostamento e imposizione dello schema per le tabelle gestite ed esterne.
Apache Iceberg Formato di tabella aperto per l'integrazione con l'ecosistema Iceberg, che supporta la gestione avanzata dei metadati.

Gestione tabelle

Configurare e ottimizzare il comportamento, la struttura e le prestazioni delle tabelle.

Caratteristica / Funzionalità Description
Vincoli di tabella Definire e applicare regole di qualità dei dati con vincoli CHECK e non vincoli Null.
Imposizione dello schema Controllare in che modo Azure Databricks gestisce le modifiche dello schema e l'imposizione del tipo di dati durante le scritture.
Partizionamento delle tabelle Organizzare i dati in base alle chiavi di partizione per migliorare le prestazioni delle query e la gestione dei dati.
Monitoraggio delle dimensioni delle tabelle Monitorare e analizzare i modelli di utilizzo e crescita dell'archiviazione tabelle.
Convertire l'esterno in gestito Eseguire la migrazione di tabelle esterne a tabelle gestite per migliorare le prestazioni e la gestione.
Individuazione partizione esterna Individuare e registrare automaticamente le partizioni in tabelle esterne archiviate nell'archiviazione cloud.