Utilize vistas materializadas independentes

Esta página descreve como criar e atualizar vistas materializadas autónomas para melhorar o desempenho e reduzir o custo das suas cargas de processamento e análise de dados.

Pode criar e atualizar vistas materializadas independentes a partir de um SQL warehouse do Databricks ou num notebook executado em computação sem servidor de uso geral. Para detalhes sobre as diferenças entre as duas opções de computação, veja Requisitos para pipelines independentes.

O que são opiniões materializadas autónomas?

Uma vista materializada autónoma é uma tabela gerida pelo Unity Catalog que armazena fisicamente os resultados de uma consulta, definida fora dos Lakeflow Spark Declarative Pipelines. Ao contrário das vistas padrão, que calculam resultados a pedido, as visualizações materializadas armazenam os resultados em cache e atualizam-nos à medida que as tabelas de origem subjacentes mudam, seja num calendário ou automaticamente.

As visualizações materializadas são adequadas para cargas de trabalho de processamento de dados, como processamento de extração, transformação e carga (ETL). As visualizações materializadas fornecem uma maneira simples e declarativa de processar dados para conformidade, correções, agregações ou captura geral de dados de alteração (CDC). As visualizações materializadas também permitem transformações fáceis de usar, limpando, enriquecendo e desnormalizando tabelas base. Ao pré-calcular consultas caras ou usadas com frequência, as visualizações materializadas reduzem a latência da consulta e o consumo de recursos. Em muitos casos, eles podem calcular incrementalmente as alterações das tabelas de origem, melhorando ainda mais a eficiência e a experiência do usuário final.

Os seguintes são casos de uso comuns para visões materializadas:

Manter um painel de BI atualizado com latência mínima de consulta do usuário final.
Reduzindo a orquestração complexa de ETL com lógica SQL simples.
Construção de transformações complexas e estratificadas.
Quaisquer casos de uso que exijam performance consistente com insights atualizados up-to.

Quando cria uma vista materializada num armazém de SQL Databricks, é criado um pipeline sem servidor para processar a criação e as atualizações da vista materializada. Você pode monitorar o status das operações de atualização no Gerenciador de Catálogos. Consulte Ver detalhes com DESCRIBE EXTENDED.

Requisitos

Para opções de computação, permissões e outros requisitos para criar, atualizar e consultar vistas materializadas autónomas, consulte Requisitos para pipelines independentes.

Para saber mais sobre outras restrições ao uso de visões materializadas, consulte Limitações.

Criar uma vista materializada

As operações de vista CREATE materializada do Databricks SQL utilizam um armazém de dados SQL do Databricks para criar e carregar dados na vista materializada. Criar uma visualização materializada é uma operação síncrona, o que significa que o CREATE MATERIALIZED VIEW comando bloqueia até que a visualização materializada seja criada e a carga inicial de dados termine. Um pipeline sem servidor é automaticamente criado para cada vista materializada do Databricks SQL. Quando a exibição materializada é atualizada, o pipeline processa a atualização.

Para criar uma visão materializada, use a instrução CREATE MATERIALIZED VIEW. Para submeter uma instrução CREATE, use o editor SQL na interface do Azure Databricks, a Databricks SQL CLI ou a Databricks SQL API.

O usuário que cria uma visão materializada é o proprietário da visão materializada.

Vista materializada ad hoc

O exemplo a seguir cria a exibição mv1 materializada a partir da tabela base_table1base:

-- This query defines the materialized view:
CREATE OR REPLACE MATERIALIZED VIEW mv1
AS SELECT
  date,
  sum(sales) AS sum_of_sales
FROM
  base_table1
GROUP BY
  date;

Vista materializada no gatilho

O exemplo seguinte cria uma vista materializada que se atualiza automaticamente sempre que os dados de origem a montante mudam usando TRIGGER ON UPDATE. Use esta abordagem para cargas de trabalho em produção, especialmente quando as dependências a montante não funcionam em cronogramas previsíveis.

-- Refresh automatically when the source table is updated.
CREATE OR REPLACE MATERIALIZED VIEW mv_trigger
  TRIGGER ON UPDATE
AS SELECT
  date,
  sum(sales) AS sum_of_sales
FROM
  base_table1
GROUP BY
  date;

Visualização materializada programada

O exemplo seguinte cria uma vista materializada com um calendário diário de atualização do CRON à meia-noite UTC. Expressões e agregados na cláusula SELECT devem usar apelidos. GROUP BY As referências às colunas não requerem aliases.

-- Refresh nightly at midnight UTC.
-- The cron expression uses six space-separated fields: seconds minutes hours day-of-month month day-of-week
-- Use '?' for either day-of-month or day-of-week to leave it unspecified.
CREATE OR REPLACE MATERIALIZED VIEW daily_revenue_by_region
  SCHEDULE CRON '0 0 0 * * ?' AT TIME ZONE 'UTC'
AS SELECT
  date_trunc('day', order_time) AS sales_date,
  region,
  sum(revenue) AS total_revenue,
  count(*) AS order_count
FROM
  orders
GROUP BY sales_date, region;

Para mais opções de agendamento, incluindo SCHEDULE EVERY sintaxe e exemplos adicionais de CRON, consulte Atualizações de Agendamento.

Quando você cria uma exibição materializada usando a CREATE OR REPLACE MATERIALIZED VIEW instrução, a atualização inicial de dados e a população começam imediatamente. Isso não consome a computação do SQL warehouse. Em vez disso, um pipeline sem servidor é usado para criação e atualizações subsequentes. Veja Como as visualizações materializadas do SQL do Databricks são atualizadas?

Os comentários das colunas numa tabela base são propagados automaticamente para a nova vista materializada apenas aquando da sua criação. Para adicionar uma agenda, restrições de tabela ou outras propriedades, modifique a definição de exibição materializada (a consulta SQL).

A mesma instrução SQL atualiza uma visualização materializada se for chamada numa nova ocasião ou num calendário. Uma atualização feita desta forma funciona como qualquer outra atualização. Para obter detalhes, consulte Atualizar uma exibição materializada.

Para saber mais sobre como configurar uma vista materializada, consulte Configurar vistas materializadas autónomas. Para saber mais sobre a sintaxe completa para criar uma exibição materializada, consulte CREATE MATERIALIZED VIEW. Para saber mais sobre como carregar dados em formatos diferentes e de locais diferentes, consulte Carregar dados em pipelines.

Carregar dados de sistemas externos

Vistas materializadas podem ser criadas em dados externos usando a Lakehouse Federation para fontes de dados suportadas. Para obter informações sobre como carregar dados de fontes não suportadas pela Lakehouse Federation, consulte Opções de formato de dados. Para obter informações gerais sobre como carregar dados, incluindo exemplos, consulte Carregar dados em pipelines.

Ocultar dados confidenciais

Você pode usar exibições materializadas para ocultar dados confidenciais dos usuários que acessam a tabela. Uma maneira de fazer isso é criar a consulta para que ela não inclua esses dados em primeiro lugar. Mas você também pode mascarar colunas ou filtrar linhas com base nas permissões do usuário que está consultando. Por exemplo, você pode ocultar a tax_id coluna para usuários que não estão no grupo HumanResourcesDept. Para fazer isto, use a sintaxe ROW FILTER e MASK durante a criação da vista materializada. Para obter mais informações, consulte Filtros de linha e máscaras de coluna.

Atualizar uma vista materializada

A atualização de um modo de exibição materializado atualiza o modo de exibição para refletir as alterações mais recentes na tabela base no momento da atualização.

Quando você define um modo de exibição materializado, a CREATE OR REPLACE MATERIALIZED VIEW instrução é usada para criar o modo de exibição e para atualizá-lo para quaisquer atualizações agendadas. Você também pode usar a REFRESH MATERIALIZED VIEW instrução para atualizar a exibição materializada sem precisar fornecer a consulta novamente. Consulte REFRESH (MATERIALIZED VIEW ou STREAMING TABLE) para obter detalhes sobre a sintaxe SQL e os parâmetros para este comando. Para saber mais sobre os tipos de modos de exibição materializados que podem ser atualizados incrementalmente, consulte Atualização incremental para modos de exibição materializados.

Para submeter uma instrução de atualização, use o editor SQL na interface Azure Databricks, um caderno ligado a um armazenamento SQL, a Databricks SQL CLI, ou a API SQL Databricks.

O proprietário e qualquer usuário que tenha recebido o REFRESH privilégio na tabela pode atualizar a exibição materializada.

O seguinte exemplo atualiza a mv1 exibição materializada:

REFRESH MATERIALIZED VIEW mv1;

A operação é síncrona por padrão, o que significa que o comando bloqueia até que a operação de atualização seja concluída. Para atualizar de forma assíncrona, você pode adicionar a ASYNC palavra-chave:

REFRESH MATERIALIZED VIEW mv1 ASYNC;

Para saber como agendar uma atualização, consulte Atualizações de Agendamento.

Como as exibições materializadas do Databricks SQL são atualizadas?

As visualizações materializadas criam e usam automaticamente pipelines sem servidor para processar operações de atualização. A atualização é gerenciada pelo pipeline e a atualização é monitorada pelo armazém SQL Databricks usado para criar a exibição materializada. As visualizações materializadas podem ser atualizadas usando um pipeline que corre num calendário. Databricks SQL cria sempre visualizações materializadas que são executadas no modo acionado. Consulte Modo de fluxo de trabalho acionado versus contínuo.

As atualizações agendadas podem ter notificações de atualização, e pode definir o modo de desempenho para a atualização.

Atualização incremental

As visualizações materializadas são atualizadas usando um dos dois métodos.

Atualização incremental - O sistema avalia a consulta da exibição para identificar alterações que aconteceram após a última atualização e mescla apenas os dados novos ou modificados.
Atualização completa - Se uma atualização incremental não for possível ou não for rentável, o sistema executa toda a consulta e substitui os dados existentes na vista materializada pelos novos resultados.

A estrutura da consulta e o tipo de dados de origem determinam se a atualização incremental é suportada. Para oferecer suporte à atualização incremental, os dados de origem devem ser armazenados em tabelas Delta, com o rastreamento de linhas e o feed de dados de alteração habilitados. Para ver se uma consulta é incremental, use a instrução SQL EXPLAIN CREATE MATERIALIZED VIEW do Databricks. Depois de criar uma exibição materializada, você pode monitorar seu comportamento de atualização para verificar se ela é atualizada incrementalmente ou por meio de uma atualização completa.

Por defeito, o Azure Databricks utiliza um modelo de custos para escolher a opção mais económica entre renovação total e incremental. Pode substituir este comportamento para preferir atualizações incrementais ou completas, definindo a REFRESH POLICY na sua definição SQL da visualização materializada.

Para obter detalhes sobre tipos de atualização e como otimizar para atualizações incrementais, consulte Atualização incremental para exibições materializadas.

Atualizações assíncronas

Por padrão, as operações de atualização são executadas de forma síncrona. Você também pode definir uma operação de atualização para ocorrer de forma assíncrona. Isso pode ser definido usando o comando refresh com a ASYNC palavra-chave. Ver REFRESH (MATERIALIZED VIEW ou STREAMING TABLE). O comportamento associado a cada abordagem é o seguinte:

Síncrono: uma atualização síncrona impede que outras operações prossigam até que a atualização seja concluída. Se o resultado for necessário para a próxima etapa, como ao sequenciar operações de atualização em ferramentas de orquestração como Lakeflow Jobs, use uma atualização síncrona. Para orquestrar visões materializadas com uma tarefa, use o tipo de tarefa SQL. Veja Lakeflow Jobs.
Assíncrona: uma atualização assíncrona inicia um trabalho em segundo plano na computação sem servidor quando uma atualização de exibição materializada começa, permitindo que o comando retorne antes que a carga de dados seja concluída. Esse tipo de atualização pode economizar custos porque a operação não necessariamente mantém a capacidade de computação no depósito onde o comando é iniciado. Se a tarefa de atualização ficar ociosa e nenhuma outra tarefa estiver em execução, o depósito poderá ser desligado enquanto utiliza outro recurso de computação disponível. Além disso, as atualizações assíncronas suportam a inicialização de várias operações em paralelo.

Excluir permanentemente registros de uma exibição materializada com vetores de exclusão habilitados

Importante

O suporte para a declaração REORG com vistas materializadas está em Pré-visualização Pública.

Observação

Usar uma instrução REORG com uma vista materializada requer o Databricks Runtime 15.4 ou superior.
Embora você possa usar a REORG instrução com qualquer exibição materializada, ela só é necessária ao excluir registros de uma exibição materializada com vetores de exclusão habilitados. O comando não tem efeito quando usado com uma visualização materializada sem vetores de exclusão habilitados.

Para excluir fisicamente registros do armazenamento subjacente para uma exibição materializada com vetores de exclusão habilitados, como para conformidade com o GDPR, etapas adicionais devem ser tomadas para garantir que uma VACUUM operação seja executada nos dados da exibição materializada.

Para excluir registros fisicamente:

Execute uma declaração REORG na vista materializada, especificando o parâmetro APPLY (PURGE). Por exemplo, REORG TABLE <materialized-view-name> APPLY (PURGE);. Consulte REORG TABLE.
Aguarde até que o período de retenção de dados da vista materializada passe. O período de retenção de dados padrão é de sete dias, mas pode ser configurado com a propriedade delta.deletedFileRetentionDuration table. Consulte Configuração de retenção de dados para consultas de viagem no tempo.
REFRESH a visão materializada. Ver Atualizar uma vista materializada. Dentro de 24 horas após a operação, as tarefas de manutenção do gasoduto, incluindo a REFRESH operação necessária para garantir que os VACUUM registros sejam excluídos permanentemente, são executadas automaticamente.

Elimine a visão materializada

Observação

Para enviar o comando para eliminar uma visão materializada, deve ser o proprietário dessa visão materializada ou ter o privilégio MANAGE na visão materializada.

Para eliminar uma visão materializada, use a instrução DROP VIEW. Para submeter uma instrução DROP, pode usar o editor SQL na interface Azure Databricks, a Databricks SQL CLI ou a API SQL Databricks. O exemplo a seguir descarta a mv1 visão materializada:

DROP MATERIALIZED VIEW mv1;

Você também pode usar o Catalog Explorer para eliminar uma exibição materializada.

Clique no Catálogo na barra lateral.
Na árvore do Catalog Explorer à esquerda, abra o catálogo e selecione o esquema onde sua exibição materializada está localizada.
Abra o item Tabelas sob o esquema selecionado e clique na vista materializada.
No , selecione Eliminar.

Compreender os custos de uma visão materializada

Quando executa CREATE MATERIALIZED VIEW ou REFRESH MATERIALIZED VIEW, o Azure Databricks cria e executa automaticamente um pipeline sem servidor para processar a operação. Este pipeline é independente do Databricks SQL warehouse ou recurso de computação a partir do qual submeteu o comando. O tamanho do cluster do seu armazém não limita o cálculo ou o custo utilizado pela atualização.

O pipeline de atualização corre em computação serverless, apresentada como DBUs serverless Lakeflow Spark Declarative Pipelines.
O pipeline serverless é separado do seu data warehouse. O processamento a partir do seu armazém é usado apenas para coordenar a operação, não para realizar o processamento de dados.
O custo escala com o volume de dados processados, e não com o tamanho do seu armazém de dados SQL.
Para monitorizar os custos de atualização da vista materializada, utilize tabelas do sistema. Consulte Qual é o consumo de unidades de DBU de uma visualização materializada ou tabela de streaming?
Para visualizar o pipeline subjacente que gerencia a sua visão materializada:
1. Clique Tarefas & Pipelines na barra lateral esquerda no espaço de trabalho do seu Azure Databricks.
2. Clique em Tipo de Pipeline. Depois, selecione MV/ST Pipeline para ver vistas materializadas criadas em Databricks SQL.

Observação

Pode incorrer em custos associados à computação serverless mesmo quando o armazém de origem utiliza computação dedicada.

Ativando o rastreamento de linhas

Para suportar atualizações incrementais a partir de tabelas Delta, o rastreamento de linhas deve estar ativado para essas tabelas de origem. Se você recriar uma tabela de origem, deverá reativar o rastreamento de linha.

O exemplo a seguir mostra como ativar o rastreio de linhas numa tabela:

ALTER TABLE source_table SET TBLPROPERTIES (delta.enableRowTracking = true);

Para mais detalhes, veja Rastreamento de linhas em Databricks

Limitações

Para opções de computação e requisitos de espaço de trabalho, veja Requisitos para pipelines autónomas.
Para requisitos de atualização incremental, consulte Atualização incremental para exibições materializadas.
As visualizações materializadas não suportam colunas de identidade ou chaves substitutas.
Se uma vista materializada usa uma soma agregada sobre uma coluna NULL-able e apenas NULL valores permanecem nessa coluna, o valor agregado resultante da vista materializada é zero em vez de NULL.
Não é possível ler um feed de dados de alterações a partir de uma exibição materializada.
As consultas de deslocação no tempo não são suportadas em visões materializadas.
Os arquivos subjacentes que suportam visualizações materializadas podem incluir dados de tabelas upstream (incluindo possíveis informações pessoalmente identificáveis) que não aparecem na definição de exibição materializada. Esses dados são adicionados automaticamente ao armazenamento subjacente para oferecer suporte à atualização incremental de exibições materializadas. Como os arquivos subjacentes de uma exibição materializada podem correr o risco de expor dados de tabelas upstream que não fazem parte do esquema de exibição materializado, o Databricks recomenda não compartilhar o armazenamento subjacente com consumidores downstream não confiáveis. Por exemplo, suponha que a definição de uma visão materializada inclua uma COUNT(DISTINCT field_a) cláusula. Embora a definição da vista materializada inclua apenas a cláusula agregada COUNT DISTINCT , os ficheiros subjacentes contêm uma lista dos valores reais de field_a.
Pode incorrer em alguns encargos de computação sem servidor, mesmo ao utilizar estas funcionalidades em computação dedicada.

Se precisar de usar uma ligação Azure Private Link com a sua visualização materializada, contacte o seu representante Databricks.

Aceda a visualizações materializadas de clientes externos

Para acessar visualizações materializadas de clientes externos Delta Lake ou Iceberg que não suportam APIs abertas, você pode usar o Modo de Compatibilidade. O Modo de Compatibilidade cria uma versão somente leitura da sua visualização materializada que pode ser acessada por qualquer cliente Delta Lake ou Iceberg.

Comentários

Esta página foi útil?

Last updated on 2026-06-01

Utilize vistas materializadas independentes

O que são opiniões materializadas autónomas?

Requisitos

Criar uma vista materializada

Vista materializada ad hoc

Vista materializada no gatilho

Visualização materializada programada

Carregar dados de sistemas externos

Ocultar dados confidenciais

Atualizar uma vista materializada

Como as exibições materializadas do Databricks SQL são atualizadas?

Atualização incremental

Atualizações assíncronas

Excluir permanentemente registros de uma exibição materializada com vetores de exclusão habilitados

Elimine a visão materializada

Compreender os custos de uma visão materializada

Ativando o rastreamento de linhas

Limitações

Aceda a visualizações materializadas de clientes externos

Artigos relacionados

Comentários

Recursos adicionais