Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Azure Databricks offre più tipi di tabella e formati di archiviazione per soddisfare esigenze di gestione dei dati diverse. Questa sezione illustra tabelle gestite, esterne ed esterne, insieme ai formati di archiviazione Delta Lake e Apache Iceberg che supportano funzionalità avanzate come Atomicità, Coerenza, Isolamento e Durabilità (ACID) e il viaggio in tempo.
Concetti principali
Informazioni sui concetti fondamentali sui tipi di tabella, i formati di archiviazione e l'integrazione del catalogo Unity.
| Argomento | Description |
|---|---|
| Concetti relativi alle tabelle | Concetti di base e informazioni fondamentali sui tipi di tabella, i formati di archiviazione e l'integrazione del catalogo Unity. |
Tipi di tabella
Esplorare i diversi tipi di tabella e le relative funzionalità per vari scenari di gestione dei dati.
| Tipo di tabella | Description |
|---|---|
| Tabelle gestite | Tabelle in cui Azure Databricks gestisce sia i metadati che i file di dati. Consigliato per le nuove tabelle con prestazioni e archiviazione ottimizzate. |
| tabelle esterne | Tabelle che fanno riferimento ai dati archiviati in sistemi di archiviazione esterni durante la gestione dei metadati nel catalogo Unity. |
| Tabelle esterne | Tabelle di sola lettura che rappresentano i dati nei sistemi esterni connessi tramite Lakehouse Federation. |
Formati di archiviazione
Usare formati di tabella aperti che offrono funzionalità avanzate di gestione dei dati.
| Formato | Description |
|---|---|
| Delta Lake | Il formato di archiviazione predefinito fornisce transazioni ACID, tempo di spostamento e imposizione dello schema per le tabelle gestite ed esterne. |
| Apache Iceberg | Formato di tabella aperto per l'integrazione con l'ecosistema Iceberg, che supporta la gestione avanzata dei metadati. |
Gestione tabelle
Configurare e ottimizzare il comportamento, la struttura e le prestazioni delle tabelle.
| Caratteristica / Funzionalità | Description |
|---|---|
| Vincoli di tabella | Definire e applicare regole di qualità dei dati con vincoli CHECK e non vincoli Null. |
| Imposizione dello schema | Controllare in che modo Azure Databricks gestisce le modifiche dello schema e l'imposizione del tipo di dati durante le scritture. |
| Partizionamento delle tabelle | Organizzare i dati in base alle chiavi di partizione per migliorare le prestazioni delle query e la gestione dei dati. |
| Monitoraggio delle dimensioni delle tabelle | Monitorare e analizzare i modelli di utilizzo e crescita dell'archiviazione tabelle. |
| Convertire l'esterno in gestito | Eseguire la migrazione di tabelle esterne a tabelle gestite per migliorare le prestazioni e la gestione. |
| Individuazione partizione esterna | Individuare e registrare automaticamente le partizioni in tabelle esterne archiviate nell'archiviazione cloud. |