Almacenamiento predeterminado en Databricks

En esta página se explica cómo funciona el almacenamiento predeterminado en Azure Databricks y cómo crear catálogos y objetos de datos que lo usan.

¿Qué es el almacenamiento predeterminado?

El almacenamiento predeterminado es una plataforma de almacenamiento de objetos totalmente administrada que proporciona almacenamiento listo para usar en la cuenta de Azure Databricks. Algunas características de Azure Databricks usan el almacenamiento predeterminado como alternativa al almacenamiento externo.

Las áreas de trabajo sin servidor usan el almacenamiento predeterminado para el almacenamiento interno y del área de trabajo, y para el catálogo predeterminado que se crea con el área de trabajo. En las áreas de trabajo sin servidor, puede crear catálogos adicionales en el almacenamiento predeterminado o en su propio almacenamiento de objetos en la nube.

En las áreas de trabajo clásicas y las áreas de trabajo sin servidor, las características usan el almacenamiento predeterminado para almacenar elementos como metadatos del plano de control, datos derivados, modelos y otros artefactos. Por ejemplo, Clean Rooms, Data Classification, detección de anomalías, Knowledge Assistant y restauración automática de sesiones para notebooks sin servidor usan el almacenamiento predeterminado de un área de trabajo. Consulte la documentación de características individuales para obtener más información sobre lo que almacena cada característica en el almacenamiento predeterminado.

Nota:

Para obtener información sobre la supervisión de los costos de almacenamiento predeterminados en su cuenta, consulte Supervisión de los costos de almacenamiento predeterminados.

Requisitos

La creación de catálogos en el almacenamiento predeterminado solo está disponible en áreas de trabajo sin servidor.
De forma predeterminada, los catálogos que usan el almacenamiento predeterminado solo son accesibles desde el área de trabajo donde se crean. Puede conceder acceso a otras áreas de trabajo, incluidas las áreas de trabajo clásicas, pero deben utilizar computación sin servidor para acceder a los datos del catálogo. Consulte Vinculación de catálogo de espacio de trabajo.
Debe tener CREATE CATALOG privilegios para crear un catálogo con almacenamiento predeterminado. Consulte Referencia de privilegios de Unity Catalog.
Si el cliente usa el controlador ODBC de Azure Databricks para acceder a un catálogo de almacenamiento predeterminado desde detrás de un firewall, debe configurar el firewall para permitir el acceso a las puertas de enlace de almacenamiento regionales de Azure Databricks. Para más información sobre ip y nombre de dominio para el almacenamiento predeterminado, consulte Direcciones IP y dominios para los servicios y recursos de Azure Databricks.

Creación de un catálogo

Complete los pasos siguientes para crear un nuevo catálogo mediante el almacenamiento predeterminado:

Haga clic en Catálogo en la barra lateral. Aparece el Explorador de catálogos.
Haga clic en Crear catálogo. Aparece el cuadro de diálogo Crear un catálogo .
Proporcione un nombre de catálogo que sea único en su cuenta.
Seleccione la opción Usar almacenamiento predeterminado.
Haga clic en Crear.

En las áreas de trabajo sin servidor, también puede usar el siguiente comando SQL para crear un nuevo catálogo en el almacenamiento predeterminado. No es necesario especificar una ubicación para el catálogo.

CREATE CATALOG [ IF NOT EXISTS ] catalog_name
    [ COMMENT comment ]

Trabajar con almacenamiento predeterminado

Todas las interacciones con el almacenamiento predeterminado requieren recursos de computación sin servidor habilitados para el Catálogo de Unity.

Los recursos respaldados por el almacenamiento predeterminado usan el mismo modelo de privilegios que otros objetos del catálogo de Unity. Debe tener privilegios suficientes para crear, ver, consultar o modificar objetos de datos. Consulte Referencia de privilegios de Unity Catalog.

Para trabajar con el almacenamiento predeterminado, cree e interactúe con tablas administradas y volúmenes administrados respaldados por el almacenamiento predeterminado. Consulte las tablas administradas de Unity Catalog para Delta Lake y Apache Iceberg y ¿Qué son los volúmenes de Unity Catalog?.

Puede usar el Explorador de catálogos, los cuadernos, el editor de SQL y los paneles para interactuar con los objetos de datos almacenados en el almacenamiento predeterminado.

Tareas de ejemplo

A continuación se muestran ejemplos de tareas que puede completar con el almacenamiento predeterminado:

Cargue archivos locales en un volumen administrado o para crear una tabla administrada. Consulte Trabajar con archivos en volúmenes del catálogo de Unity y Crear o modificar una tabla mediante la carga de archivos.
Consulta de datos con cuadernos. Consulte Tutorial: Consulta y visualización de datos desde un cuaderno.
Crear un tablero. Consulte Creación de un panel.
Consulta de datos con SQL y programación de consultas SQL. Consulte Escritura de consultas y exploración de datos en el nuevo editor de SQL.
Importar datos desde un volumen externo hacia una tabla administrada. Consulte Uso del cargador automático con el catálogo de Unity.
Ingesta de datos en una tabla administrada con Fivetran. Consulte Conexión a Fivetran.
Use herramientas de BI para explorar tablas administradas. Consulte Conexión de Tableau y Azure Databricks y Power BI con Azure Databricks.
Ejecute cuadernos sin servidor. Consulte Proceso sin servidor para cuadernos.
Ejecute trabajos sin servidor. Consulte Ejecute sus trabajos de Lakeflow con computación sin servidor para flujos de trabajo.
Ejecute los puntos de conexión de servicio del modelo. Consulte Implementación de modelos mediante Model Serving.
Ejecute canalizaciones de Lakeflow sin servidor. Consulte Configuración de una canalización sin servidor.
Use la optimización predictiva en las tablas. Consulte Optimización predictiva para tablas administradas de Unity Catalog.

Ciclo de vida de almacenamiento después de quitar un objeto

Al eliminar una tabla administrada o un volumen que usa el almacenamiento predeterminado, los archivos de datos se conservan para permitir una ventana de recuperación de 7 días. Una vez finalizada la ventana de recuperación, los archivos de datos se eliminan permanentemente (purgan) en un plazo de 48 horas. La facturación del almacenamiento continúa durante la ventana de recuperación y se detiene una vez finalizada la ventana de recuperación. Para obtener más información sobre el ciclo de vida de los archivos de datos, la facturación y las opciones de recuperación, consulte Ciclo de vida de almacenamiento de objetos en el catálogo de Unity.

Limitaciones

Se presentan las siguientes limitaciones:

El proceso clásico (cualquier proceso que no sea sin servidor) no puede interactuar con los recursos de datos en el almacenamiento predeterminado.
OpenSharing permite compartir tablas con cualquier destinatario, abierto o de Azure Databricks, y los destinatarios pueden usar cómputo clásico para acceder a las tablas compartidas (Vista previa pública). Habilite la característica OpenSharing para almacenamiento predeterminado: acceso expandido en la consola de la cuenta.
- Esta característica no se admite en las siguientes regiones: southcentralus, uksouthy westus2.
- Todos los demás recursos que se pueden compartir solo se pueden compartir con Azure Databricks destinatarios en la misma nube. Los destinatarios deben usar computación sin servidor.
No se pueden compartir tablas con particiones habilitadas.
Los clientes externos de Iceberg y Delta no pueden acceder directamente a los metadatos subyacentes, la lista de manifiestos y los archivos de datos de las tablas UC en el almacenamiento predeterminado (no se admite el acceso a FileIO). Sin embargo, las herramientas de BI, como Power BI y Tableau, pueden acceder a las tablas del catálogo de Unity en el almacenamiento predeterminado mediante controladores ODBC y JDBC. Los clientes externos también pueden acceder a los volúmenes del catálogo de Unity en el almacenamiento predeterminado mediante la API de archivos.
El almacenamiento predeterminado admite el acceso externo a través de controladores ODBC y JDBC de Azure Databricks, incluida la optimización del rendimiento de Cloud Fetch del controlador ODBC para las consultas en conjuntos de datos más grandes. Sin embargo, si tiene acceso a una tabla de almacenamiento predeterminada desde un área de trabajo que tiene habilitado Private Link front-end, las consultas de cliente ODBC que devuelven resultados mayores que aproximadamente 5 MiB producirán un error porque la optimización de Cloud Fetch para las tablas de almacenamiento predeterminadas no admite actualmente Private Link front-end.
No se admite la distribución de credenciales, por ejemplo, cuando los sistemas externos se conectan a la API REST de Unity o al catálogo REST de Iceberg. Consulte Provisión de credenciales de Unity Catalog para el acceso a sistemas externos.

Comentarios

¿Le ha resultado útil esta página?

Last updated on 2026-07-24