Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
En esta página se describen los requisitos para crear y actualizar vistas materializadas independientes y tablas de streaming.
Puede crear y actualizar vistas materializadas independientes y tablas de streaming mediante una instancia de SQL Warehouse. Para enviar instrucciones CREATE y REFRESH, use el editor de SQL en la interfaz de usuario de Azure Databricks, la CLI de SQL de Databricks o la Databricks SQL API.
También puede crear y actualizar vistas materializadas independientes y tablas de streaming desde un cuaderno que se ejecuta en un proceso general sin servidor (beta, disponibilidad regional limitada). Consulte Portátiles.
Requisitos generales
Los siguientes requisitos se aplican a todas las canalizaciones independientes.
Debe disponer de lo siguiente:
- Una cuenta de Azure Databricks con el almacén sin servidor habilitado. Consulte Configuración de almacenes sql sin servidor.
- Un área de trabajo con Unity Catalog habilitado. Consulte Introducción al catálogo de Unity.
Permisos para crear o actualizar
El propietario (el usuario que crea la tabla) debe tener los permisos siguientes:
-
SELECTprivilegios en las tablas base. - privilegios
USE CATALOGyUSE SCHEMAsobre el catálogo y el esquema que contienen las tablas de origen. - privilegios
USE CATALOGyUSE SCHEMAen el catálogo y el esquema de destino. -
CREATE MATERIALIZED VIEWprivilegio en el esquema que contiene la vista materializada. -
CREATE TABLEprivilegio sobre el esquema que contiene la tabla de transmisión. Las canalizaciones que usan el modo de publicación heredado también requieren elCREATE TABLEprivilegio para las vistas materializadas.
Para actualizar una vista materializada independiente o una tabla de streaming:
- Debe estar en el espacio de trabajo que lo creó.
- Debe tener el privilegio
REFRESHen la tabla. Los propietarios tienen este privilegio implícitamente.
Requisitos de la tabla de origen
Para actualizar incrementalmente las vistas materializadas de las tablas Delta, las tablas de origen deben tener habilitado el seguimiento de filas.
Almacenes de SQL
Para crear o actualizar vistas materializadas independientes y tablas de streaming mediante un almacén SQL, debe contar con un almacén SQL pro o sin servidor con Unity Catalog habilitado.
- El área de trabajo debe estar en una región que admita almacenes de SQL sin servidor.
Notebooks
Puede crear y actualizar vistas materializadas independientes y tablas de streaming desde un cuaderno con proceso general sin servidor.
Proceso general sin servidor
Important
La creación y actualización de vistas materializadas independientes y tablas de streaming desde un notebook en cómputo general sin servidor está en Beta. Esta característica solo está disponible en regiones seleccionadas. Consulte Disponibilidad regional.
Puede crear y refrescar vistas materializadas independientes y tablas de streaming desde un notebook conectado a cómputo general sin servidor. Esta opción es útil cuando desea definir y ejecutar vistas materializadas o tablas de streaming junto con otros flujos de trabajo basados en cuadernos sin aprovisionar un almacén de SQL.
Requisitos generales de proceso sin servidor
- Un cuaderno conectado al cómputo general sin servidor.
- Databricks Runtime 18.1 o superior. Los cuadernos interactivos cumplen este requisito automáticamente; los trabajos anclados a una versión anterior no.
- Su área de trabajo debe estar en una región admitida.
Limitaciones
- Solo el propietario de la tabla puede actualizar la tabla. Para permitir que otro usuario se actualice, cambie el propietario. Consulte Cambiar el propietario de una tabla de streaming y Cambiar el propietario de una vista materializada.
- No se admiten las actualizaciones asincrónicas. Use una actualización sincrónica en su lugar.
- No se admite el canal de vista previa. Las tablas creadas en el proceso general sin servidor usan el
currentcanal. - Una tabla solo se puede actualizar mediante el tipo de proceso con el que se creó. Una tabla creada en un almacén de SQL debe actualizarse en un almacén de SQL, y una tabla creada en cómputo general sin servidor debe actualizarse en cómputo general sin servidor. Para comprobar el tipo de cómputo, consulte la tabla en Catalog Explorer.
- La atribución y el control de costos no están disponibles. Use una instancia de SQL Warehouse si necesita atribución de costos por tabla.
- El escalado automático vertical no está disponible cuando se producen errores por falta de memoria.
- Los reintentos para las actualizaciones de los esquemas no están disponibles.
- La selección del modo de rendimiento en la actualización no está disponible. Consulte Seleccionar un modo de rendimiento para las actualizaciones programadas.
Note
spark.sql es compatible al ejecutar una actualización en un notebook con cómputo general sin servidor.
:::
Requisitos de consulta
Para consultar una vista materializada independiente o una tabla de streaming, debe ser el propietario o debe tener SELECT en la tabla junto con USE CATALOG y USE SCHEMA en sus elementos primarios.
Debe usar uno de los siguientes recursos de proceso:
- Almacén de SQL
- Interfaces de canalizaciones declarativas de Spark de Lakeflow
- Proceso del modo de acceso estándar (anteriormente modo de acceso compartido)
- Cómputo con modo de acceso dedicado (anteriormente, modo de acceso de usuario único) en Databricks Runtime 15.4 o superior, si el área de trabajo está habilitada para el cómputo sin servidor. Consulte Control de acceso detallado en la computación dedicada. Si es el propietario, puede usar recursos de proceso con modo de acceso dedicado que ejecuten Databricks Runtime 14.3 o superior.
Para una tabla de streaming en Databricks Runtime 15.3 y versiones anteriores, puede usar cómputo dedicado para consultarla solo si es de su propiedad. Databricks Runtime 15.4 LTS y versiones posteriores permiten consultar tablas generadas por canalizaciones en informática de uso dedicado, aunque no seas el propietario. Es posible que se le cobre por los recursos de computación sin servidor al usar recursos de computación dedicados para ejecutar operaciones de filtrado de datos. Consulte Control de acceso detallado en la computación dedicada.
Disponibilidad regional
Las tablas creadas y actualizadas mediante una instancia de Databricks SQL Warehouse están disponibles en todas las regiones que admiten almacenes sql de Databricks sin servidor.
La creación y actualización de vistas materializadas independientes y tablas de transmisión en cómputo general sin servidor solo está disponible en determinadas regiones.
Para obtener la lista de regiones admitidas para ambas opciones de proceso, consulte Disponibilidad sin servidor.