Compartir vía


Tablas de Azure Databricks

Azure Databricks proporciona varios tipos de tabla y formatos de almacenamiento para satisfacer diferentes necesidades de administración de datos. En esta sección se describen las tablas administradas, externas y externas, junto con los formatos de almacenamiento delta Lake y Apache Snapshot que potencian características avanzadas como atomicidad, coherencia, aislamiento y durabilidad (ACID) y viajes en el tiempo.

Conceptos básicos

Conozca los aspectos básicos de los tipos de tabla, los formatos de almacenamiento y la integración del catálogo de Unity.

Tema Description
Conceptos de tablas Conceptos básicos e información fundamental sobre los tipos de tabla, los formatos de almacenamiento y la integración del catálogo de Unity.

Tipos de tablas

Explore diferentes tipos de tabla y sus funcionalidades para diversos escenarios de administración de datos.

Tipo de tabla Description
Tablas administradas Tablas en las que Azure Databricks administra los archivos de datos y metadatos. Se recomienda para las nuevas tablas con un rendimiento y almacenamiento optimizados.
tablas externas de Tablas que hacen referencia a datos almacenados en sistemas de almacenamiento externos al administrar metadatos en el catálogo de Unity.
Tablas externas Tablas de solo lectura que representan datos en sistemas externos conectados a través de la federación de Lakehouse.

Formatos de almacenamiento

Trabaje con formatos de tabla abiertos que proporcionan funcionalidades avanzadas de administración de datos.

Formato Description
Delta Lake Formato de almacenamiento predeterminado que proporciona transacciones ACID, desplazamiento de tiempo y aplicación de esquemas para tablas administradas y externas.
Apache Iceberg Abra el formato de tabla para la integración con el ecosistema de Iceberg, lo que admite la administración avanzada de metadatos.

Administración de tablas

Configure y optimice el comportamiento, la estructura y el rendimiento de las tablas.

Característica Description
Restricciones de tabla Defina y aplique reglas de calidad de datos con restricciones check y no restricciones NULL.
Aplicación de esquemas Controlar cómo Azure Databricks controla los cambios de esquema y la aplicación del tipo de datos durante las escrituras.
Creación de particiones de tablas Organice los datos mediante claves de partición para mejorar el rendimiento de las consultas y la administración de datos.
Supervisión del tamaño de tabla Supervise y analice los patrones de uso y crecimiento de Table Storage.
Conversión externa a administrada Migre tablas externas a tablas administradas para mejorar el rendimiento y la administración.
Detección de particiones externas Detectar y registrar automáticamente particiones en tablas externas almacenadas en el almacenamiento en la nube.